JP2601111B2 - Document element retrieval device - Google Patents

Document element retrieval device

Info

Publication number
JP2601111B2
JP2601111B2 JP4308481A JP30848192A JP2601111B2 JP 2601111 B2 JP2601111 B2 JP 2601111B2 JP 4308481 A JP4308481 A JP 4308481A JP 30848192 A JP30848192 A JP 30848192A JP 2601111 B2 JP2601111 B2 JP 2601111B2
Authority
JP
Japan
Prior art keywords
image
document
search
display
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP4308481A
Other languages
Japanese (ja)
Other versions
JPH06162104A (en
Inventor
好博 嶋
昌史 古賀
達也 村上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP4308481A priority Critical patent/JP2601111B2/en
Publication of JPH06162104A publication Critical patent/JPH06162104A/en
Application granted granted Critical
Publication of JP2601111B2 publication Critical patent/JP2601111B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、紙に印刷された文書を
ベースにして、テキスト、イメージなどの文書要素に分
解し、それら文書要素を光ディスク等のマルチメディア
ファイルに蓄積、検索する文書要素の検索装置に関す
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a document element for decomposing a document printed on paper into document elements such as texts and images and storing and retrieving the document elements in a multimedia file such as an optical disk. Ru about the search equipment of <br/>.

【0002】[0002]

【従来の技術】従来の検索装置については、アイ・イー
・イー・イー、コンピュータ(1987年9月)第17
頁から第41頁(J.Conklin,Hyperte
xt:An Introduction and Su
rvey,Computer,,pp.17−41,S
eptember 1987)において論じられている
ように、ノードとリンクを持ったシステムとして、ハイ
パーテキストシステムがある。しかし、これは、本発明
の対象であるような紙に印刷された文書を扱うシステム
ではない。また、本発明のように、紙の文書をもとに文
書要素を分離して登録するというユーザインタフェース
を有していない。このため、文書要素を登録するための
使い易いインタフェース方式がいかなるものか、明らか
でなかった。
2. Description of the Related Art A conventional search apparatus is disclosed in IEE, Computer (September 1987), No. 17
Pages 41 to 41 (J. Conklin, Hyperte)
xt: An Introduction and Su
rvey, Computer, pp. 17-41, S
As discussed in Eptember 1987), there is a hypertext system as a system having nodes and links. However, this is not a system for handling documents printed on paper as the object of the present invention. In addition, unlike the present invention, there is no user interface for separating and registering document elements based on a paper document. For this reason, it was not clear what an easy-to-use interface system for registering document elements was.

【0003】また、従来の文献データベースシステム
は、イントロダクション、トウ、モダン、インフォメシ
ョンリトリーバル(1983年)第410頁から413
頁(G.Salton and M.J.McGil
l,Introductionto Modern I
nformation Retrieval,McGr
aw−Hill Book Company,pp.4
10−413,1983)に記載されているように、書
誌事項やキーワードを基にした文献単位の検索であり、
写真や図表など文書の内容を手掛かりにして所望の文書
を検索することは困難であった。また、本発明での対象
であるような紙に印刷された文書を扱うシステムではな
い。さらに、文書画像を保管するシステムとして電子フ
ァイリングシステムが、ヒタチレビュー,36,ナンバ
4(1987)第213頁から第220頁(S.Ito
h and N.Takahashi,HITFILE
650 Optical Disk Filing
System,Vol.36,No.4,1987,p
p.213−220)に記載されているが、これは文書
を一頁単位で画像として保管しており、文書の登録日、
文書番号等がインデックスとして検索に用いられてい
る。従って、学術文献等の図や写真を分離、整理して検
索するには十分ではない。このため、文書要素を検索す
るための使い易いユーザインタフェース方式がいかなる
ものか、従来明らかでなかった。
A conventional document database system is described in pages 410 to 413 of Introduction, Tow, Modern, and Information Retrieval (1983).
Page (G. Salton and MJ McGil)
l, Introduction Modern I
nformation Retrieval, McGr
aw-Hill Book Company, pp. 4
10-413, 1983), is a search in bibliographic units based on bibliographic items and keywords.
It has been difficult to search for a desired document based on the contents of the document such as a photograph or a chart. Further, the system is not a system for handling a document printed on paper as the object of the present invention. Further, as a system for storing document images, an electronic filing system has been developed by Hitachi Review, 36, Number 4 (1987), pages 213 to 220 (S. Ito).
h and N.H. Takahashi, HITFILE
650 Optical Disk Filing
System, Vol. 36, no. 4, 1987, p
p. 213-220), the document is stored as an image in page units, and the registration date of the document,
The document number or the like is used as an index in the search. Therefore, it is not enough to separate, organize, and search figures and photographs of academic literature and the like. For this reason, it has not been clear what kind of an easy-to-use user interface method for retrieving document elements.

【0004】[0004]

【発明が解決しようとする課題】上記従来技術は、文書
画像中の写真や図表など文書要素の画像を分離、蓄積し
て検索する点について配慮されておらず、文書中の図や
写真を分離、整理して検索するには十分ではないという
問題があった。本発明の目的は、紙の文書中にある写
真、図表等の文書要素を検索する使い易いユーザインタ
フェース方式を考案するところにある。本発明では紙に
印刷した文書を要素に分解して文書情報を登録する。文
書は要素を示すノードと要素間の関係を示すリンクから
なるネットワークで表され、このネットワークは画面を
介してブラウジングすることや、新しく文書を登録する
操作ができる。このネットワークのノードには文書の要
素としてテキスト、イメージを対応付けている。また、
リンクとしては、文書論理構造および参照関係等を扱
う。
The prior art described above does not consider separating, accumulating, and retrieving images of document elements such as photographs and charts in a document image. There was a problem that it was not enough to organize and search. SUMMARY OF THE INVENTION An object of the present invention is to devise an easy-to-use user interface method for retrieving document elements such as photographs and charts in a paper document. In the present invention, a document printed on paper is decomposed into elements and document information is registered. A document is represented by a network consisting of nodes indicating elements and links indicating relationships between the elements, and this network allows browsing via a screen and an operation of registering a new document. Texts and images are associated with the nodes of this network as document elements. Also,
As the link, the document logical structure and the reference relation are handled.

【0005】さらに、本発明の他の目的は、フルーカラ
ーの要素画像を高速に表示するところにある。要素画像
を拾い読みするために、ディスプレイ画面に順次フルカ
ラー画像を表示する。一枚の要素画像の表示に要する時
間が長いと、ユーザの待ち時間が多くなり、拾い読みの
効率が悪く、使い勝手がよくない。このような拾い読み
検索でユーザが画面表示のために待てる時間は、一枚の
要素画像当り、2〜3秒が限度と考えられる。それ以
上、表示に時間がかかるとユーザの待ち時間に対する我
慢の限度を越え、使い勝手が悪くなる。このため、要素
画像を高速に表示する。
Another object of the present invention is to display a full-color element image at high speed. In order to browse through the element images, full color images are sequentially displayed on the display screen. If the time required to display one element image is long, the waiting time of the user increases, the browsing efficiency is low, and the usability is not good. The time that the user can wait for screen display in such a browse search is considered to be limited to 2 to 3 seconds per one element image. If the display takes more time, the user's patience limit for the waiting time is exceeded, and the usability deteriorates. Therefore, the element images are displayed at high speed.

【0006】本発明の他の目的は、要素画像のブラウジ
ングにおいて対話的な探索を行うところにある。ディス
プレイ画面を介して目標の要素画像を探索するため、対
話的な操作を行う。ユーザが要素画像を探索するために
行う対話的な操作としては、要素画像を画面に次々に表
示するため表示モードを切り換えることや、目視により
見付けた要素画像を指定する。この対話的な探索では、
目標の要素画像に至るまでの探索の方法により、検索の
効率が異なる。ユーザが本を読む際、早読と熟読を繰り
返し行い情報を得ているが、これと同じ様に、画面に対
しても一瞥と熟視ができるよう、要素画像の表示を高速
表示と低速表示ができるようにする。
Another object of the present invention is to perform an interactive search in browsing element images. An interactive operation is performed to search for a target element image via the display screen. As an interactive operation performed by the user to search for an element image, the display mode is switched to display the element images one after another on the screen, or the element image found visually is specified. In this interactive search,
The search efficiency differs depending on the search method up to the target element image. When a user reads a book, information is obtained by repeatedly reading and reading quickly, but in the same way, the display of element images is displayed at high speed and at low speed so that the screen can be glanced and glanced at To be able to

【0007】本発明の他の目的は、文字列検索による要
素画像の絞り込みを行うところにある。多数の要素画像
の中から、拾い読みのみで所望の要素画像を探索するの
は効率的でない。このため、予め要素画像にキーワード
を付与しておき、文字列検索によって該当する要素画像
の集合を求める。文書中の要素画像には、例えば、図表
のキャプション等があり、これをキーワードとして利用
する。従って、要素画像とともにそのキャプションを抽
出し、この文字列を検索の手掛かりとなるキーワードと
して付与する。
Another object of the present invention is to narrow down element images by character string search. It is not efficient to search for a desired element image only by browsing from a large number of element images. For this reason, a keyword is previously assigned to an element image, and a set of the corresponding element images is obtained by a character string search. The element images in the document include, for example, captions of figures and tables, which are used as keywords. Therefore, the caption is extracted together with the element image, and this character string is assigned as a key word for a search.

【0008】従来の紙の文書の蓄積する電子ファイリン
グシステムでは、一次元に連続して文書要素が並んでお
り、ユーザに文書を一次元的に読むことを物理的に強制
しており、柔軟な検索が困難である。本発明の他の目的
は、文書情報を整理し概念化することにあり、ユーザは
テキストの並びの順に読むことができるだけでなく、
章、節の全体構造を木構造で表示し、重要個所の飛ばし
読み、例えば、緒言と結言を先に読むことができる。ま
た、参照関係をポインタをもとに辿ることができる。
[0008] In a conventional electronic filing system for storing paper documents, document elements are arranged one-dimensionally continuously, and a user is physically forced to read a document one-dimensionally. Searching is difficult. Another object of the present invention is to organize and conceptualize document information, so that a user can not only read in the order of text, but also
The entire structure of chapters and sections is displayed in a tree structure, and important parts can be skipped, for example, introductions and conclusions can be read first. Further, the reference relationship can be traced based on the pointer.

【0009】本発明の他の目的は、紙に印刷された文書
から要素を分離しマルチメディアファイルに登録し、検
索を行なう検索システムにおいて、特に、登録機能に関
するユーザインタフェース方法を提供することにある。
登録機能として要素画像の登録、関連性の登録、登録結
果の表示、のそれぞれについて、ユーザインタフェース
方式を備えている。
Another object of the present invention is to provide a user interface method related to a registration function in a search system for separating an element from a document printed on paper, registering the element in a multimedia file, and performing a search. .
As a registration function, a user interface system is provided for each of registration of element images, registration of relevance, and display of registration results.

【0010】[0010]

【課題を解決するための手段】上記目的を達成するた
め、要素画像を高速表示するフレームメモリを備え、当
該フレームメモリの再生ビデオ信号をディスプレイ用ビ
デオ信号と合成して表示したものである。
In order to achieve the above object, the present invention comprises a frame memory for displaying elemental images at high speed, and displays a reproduced video signal of the frame memory in combination with a video signal for display.

【0011】上記他の目的を達成するため、画面の表示
速度の切り換え機能を備えるようにしたものである。ま
た、要素画像を順次表示する際、順方向の表示および逆
方向の表示を可能とするよう、探索方向の切り換え機能
を有するようにしたものである。さらに、上記の要素画
像を順次、ウィンドゥに表示する送り表示、該当する要
素画像を注視するための静止表示を可能としており、送
り表示とこの静止表示の切り換え機能を備えるようにし
たものである。
According to another aspect of the present invention, a display speed switching function is provided. Further, when sequentially displaying the element images, a function of switching a search direction is provided so as to enable display in the forward direction and display in the reverse direction. Further, a feed display for sequentially displaying the element images in a window and a still display for gazing at the corresponding element image are possible, and a function of switching between the feed display and the still display is provided.

【0012】上記他の目的を達成するため、文書情報を
整理し概念化することができように、文書の要素を登録
するユーザインタフェース備えるようにしたものであ
る。ここでは、ディスプレイ画面を介して対話的に登録
操作を行ない、要素画像を文書画像から切り出して登録
する操作機能、要素の関連性の付与操作機能、登録結果
の表示機能、を備えるようにしたものである。また、登
録画面および検索画面方式を明らかにした。
In order to achieve the above-mentioned other object, a user interface for registering document elements is provided so that document information can be organized and conceptualized. Here, a registration operation is performed interactively through a display screen, and an operation function of cutting out and registering an element image from a document image, an operation of providing an association between elements, and a function of displaying a registration result are provided. It is. In addition, the registration screen and the search screen method were clarified.

【0013】[0013]

【作用】紙面に印刷された文書に対して、その内容を手
掛かりにして検索を行なう検索システムは、登録、検
索、印刷、編集、通信の各機能部からなる。また、この
システムにおいて、マルチメディアファイルは、文書を
要素ごとにアクセスできるよう検索属性を付与して格納
される。これらの機能部のうち、登録部では、文書の表
面をスキャナ等の入力デバイスで撮像し、その表面画像
を文書画像として採取する。また、文書を構造化して登
録すること、関連性を付与すること、図表を分離して登
録することができる。ここでは、文書画像は要素に分解
しレイアウト構造等の文書構造を抽出され、マルチメデ
ィアファイルに登録する。さらに、登録部では、文書の
要素の間の関連性を付与するとともに、図表を検索でき
るように文書中の図表を分離し登録する。一方、検索部
は、マルチメディアファイルに格納されている文書の要
素を探索するものであり、関連検索、図表検索の機能を
有する。この内、関連検索は検索システムに備えている
ディスプレイ装置の画面を介して対話的に文書要素の関
連性を辿りながら、所望の情報を入手する。また、図表
検索は、図表の縦軸や横軸等の軸名を手掛かりに該当す
る図表を探索し、画面に表示する。また、要素画像を順
次、高速に画面に表示し拾い読みの検索を行う。
A search system for performing a search on a document printed on paper by using the content as a clue comprises registration, search, printing, editing, and communication functional units. In this system, a multimedia file is stored with a search attribute added so that a document can be accessed for each element. Among these functional units, the registration unit captures an image of the surface of the document with an input device such as a scanner, and extracts the surface image as a document image. In addition, it is possible to register a document in a structured manner, to add relevance, and to register a figure and a table separately. Here, the document image is decomposed into elements, a document structure such as a layout structure is extracted, and registered in a multimedia file. Further, the registration unit gives relevance between elements of the document, and separates and registers the charts in the document so that the charts can be searched. On the other hand, the search unit searches for elements of the document stored in the multimedia file, and has functions of a related search and a chart search. Among them, the related search obtains desired information while interactively tracing the relevance of the document elements via a screen of a display device provided in the search system. In the chart search, a chart corresponding to the axis name such as the vertical axis or the horizontal axis of the chart is searched for and displayed on a screen. In addition, the element images are sequentially displayed on the screen at high speed, and a search for browsing is performed.

【0014】[0014]

【実施例】以下、本発明の実施例を図1により説明す
る。本図は、紙面に印刷された文書に対して、その文書
内容を手掛かりにして検索を行う検索システムの構成を
説明する図である。ここでは、特に写真やイラスト等の
図領域を要素画像として蓄積し、画面を介して、これら
要素画像の拾い読み(ブラウジング)を行う。この検索
システムでは、先ず、文書画像入力部100において、
紙の文書の表面画像をカラースキャナによって入力す
る。入力された文書画像に対して、文書要素の分離部1
01において、テキスト、図表等の文書要素を分離、識
別するとともに、属性登録部102において文書要素の
属性を登録する。そして、光ディスクや磁気ディスク等
の大容量記憶装置からなるマルチメディアファイル10
3内の要素画像ファイル104並びに検索属性ファイル
105に、これら要素画像および検索属性をそれぞれ登
録、蓄積する。要素画像に対する検索機能としては、通
常の文字列検索の機能と対話的な拾い読み検索の機能が
必要である。ここで、文字列検索部106は、カラーの
図表等の要素画像に付与された文字列を基に検索を行う
通常のキーワード検索機能を備えており、これによって
多数候補の文書要素画像の絞り込みを行う。また、拾い
読み検索部107では、該当する要素画像を順次画面に
表示し対話的に所望の図表を探索するブラウジング機能
が必要であり、フルカラーの要素画像を順次画面に表示
し、目的の要素画像を目視で見付け、ハードコピー等に
より保存する機能を備えている。なお、文書要素の分離
部101において、自動的に要素を分離し属性を登録す
る処理については、プロシーディング、セカンド、イン
ターナショナル、シンポジウム、オン、インタオペラブ
ルインフォメーションシステム(1988年)第213
頁から第238頁(H.Fujisawa,H.Yas
hiro,J.Higashino,Y.Shima,
Y.Nakano,T.Murakami,Docum
ent Analysis and Decompos
ition Method for Multimed
ia Contents Retrieval, Pr
oc. ofthe second Int. Sym
posium on Interoperable I
nformation Systems(ISIIS8
8),pp.231−238,1988.11.)に記
載されている。
An embodiment of the present invention will be described below with reference to FIG. FIG. 1 is a diagram illustrating a configuration of a search system that performs a search on a document printed on a paper surface using the document content as a clue. Here, in particular, diagram areas such as photographs and illustrations are stored as element images, and these element images are browsed (browsing) via a screen. In this search system, first, in the document image input unit 100,
A surface image of a paper document is input by a color scanner. For the input document image, a document element separation unit 1
In step 01, document elements such as text and charts are separated and identified, and the attribute registration unit 102 registers the attributes of the document elements. A multimedia file 10 composed of a large-capacity storage device such as an optical disk or a magnetic disk
The element images and the search attributes are registered and stored in the element image file 104 and the search attribute file 105 in No. 3 respectively. As a search function for an element image, a normal character string search function and an interactive browse search function are required. Here, the character string search unit 106 has a normal keyword search function for performing a search based on a character string given to an element image such as a color chart, and thereby narrows down a large number of candidate document element images. Do. In addition, the browsing search unit 107 needs a browsing function of sequentially displaying the corresponding element images on the screen and interactively searching for a desired chart. A full-color element image is sequentially displayed on the screen, and the target element image is displayed. It has a function to find it visually and save it as a hard copy. The processing for automatically separating elements and registering attributes in the document element separation unit 101 is described in Procedure, Second, International, Symposium, On, Interoperable Information System (1988), No. 213.
To 238 (H. Fujisawa, H. Yas)
hiro, J .; Higasino, Y .; Shima,
Y. Nakano, T .; Murakami, Docum
ent Analysis and Decompos
ition Method for Multimed
ia Contents Retrieval, Pr
oc. of the second Int. Sym
Posium on Interoperable I
nformation Systems (ISIIS8
8), p. 231-238, 1988.11. )It is described in.

【0015】図2は、検索システムの文書要素の登録部
の別の実施例である。この図は、文書要素の登録処理過
程を説明する図である。スキャナ211で入力した文書
画像210から200で示した文書構造化および属性登
録処理部において、要素を自動的に分離し、関連付けを
行ない、検索のための手掛かりとなる検索属性をマルチ
メディアファイル201に登録する。このとき、202
の編集処理部において、マルチメディアファイルへの登
録の誤りを修正することや検索属性を追加する。これに
より、データの信頼性を高めている。また検索システム
を使い易くするために、ユーザインタフェースとして、
画面203に表示された文書画像204からその構成要
素を画面を介して指定し、その検索属性を変更、追加ま
たは削除するとともに、登録した構成要素の内容や種類
等の検索属性を画面に表示する。登録すべき検索属性と
しては、要素の内容、要素の種類(図表、テキスト)、
要素のレイアウト、要素間の関連性、などがある。ま
た、ユーザインタフェースにおける登録機能として、検
索属性の変更、検索属性の追加、検索属性の削除、検索
属性の表示の各機能を備える。
FIG. 2 shows another embodiment of the document element registration unit of the search system. This figure is a diagram for explaining a document element registration process. In the document structuring and attribute registration processing unit 200 indicated by the document image 210 input by the scanner 211, elements are automatically separated and associated, and search attributes serving as clues for search are stored in the multimedia file 201. register. At this time, 202
In the editing processing section, the registration error in the multimedia file is corrected and a search attribute is added. Thereby, the reliability of data is improved. In order to make the search system easy to use, as a user interface,
The component is specified from the document image 204 displayed on the screen 203 via the screen, the search attribute is changed, added or deleted, and the search attribute such as the content and type of the registered component is displayed on the screen. . The search attributes to be registered include element content, element type (chart, text),
There are layouts of elements, relationships between elements, and the like. In addition, as a registration function in the user interface, each function of changing a search attribute, adding a search attribute, deleting a search attribute, and displaying a search attribute is provided.

【0016】図3は文書要素の関連性を説明する図であ
る。要素登録のユーザインタフェースでは、これらの要
素および関連性を登録する。文書画像300は、テキス
トや図表からなる要素301,302,303,30
4,305に分解されている。これらの要素は、文書画
像から切り出した部分画像311,312,316,3
13,314,315として矩形領域で表現されてお
り、「 is a part of 」の関係322,323,32
4,325,326,327で頁全体の画像300とリ
ンクされている。また、要素同士については、論理構造
の階層関係や参照関係の関連性を有しており、例えば、
図311とその図の説明文312とは参照関係を示すリ
ンク320でつながっている。検索システムのユーザイ
ンタフェースにおいては、このような文書画像の要素を
図2に示すディスプレイ装置203、マウス205、キ
ーボード206を用いて登録することになる。
FIG. 3 is a diagram for explaining the relevance of document elements. In the element registration user interface, these elements and their relationships are registered. The document image 300 is composed of elements 301, 302, 303, and 30 composed of text and charts.
4,305. These elements are the partial images 311, 312, 316, 3 cut out from the document image.
13, 314, 315 are represented by rectangular areas, and the relations 322, 323, 32 of "is a part of"
4, 325, 326, and 327 are linked to the image 300 of the entire page. In addition, the elements have a hierarchical relationship or a reference relationship of a logical structure, and for example,
FIG. 311 and the description 312 of the figure are connected by a link 320 indicating a reference relationship. In the user interface of the search system, such a document image element is registered using the display device 203, the mouse 205, and the keyboard 206 shown in FIG.

【0017】要素登録のユーザインタフェースでは、登
録した要素の変更、削除並びに追加の操作を行なう。こ
の要素登録では、要素の内容すなわち部分画像を設定す
る機能、要素の種類を設定する機能、レイアウトや要素
間の関連性を設定する機能がユーザインタフェースに備
えている。この内、要素画像の設定機能では、要素を文
書画像内において矩形領域として指定し、その領域の部
分画像を切り出す。これにより、要素の変更や追加が可
能である。図4は、文書画像内の矩形設定インタフェー
スの説明図である。ディスプレイ画面400において、
頁全体の画像401を表示し切り出し矩形を設定するこ
とになり、ディスプレイ上のカーソル位置により矩形4
02を設定する方法と、キーボードにより座標設定ウィ
ンドウ410において、座標値411,412を入力す
る方法が併用できることとする。前者の方法では、頁全
体の画像を表示し、ディスプレイ上のカーソルを移動
し、その位置座標を入力する。このとき、要素画像は矩
形領域で表されているため、矩形の左上隅の頂点403
と右下隅の頂点404をカーソルで設定しその座標を入
力する。
In the element registration user interface, the registered elements are changed, deleted, and added. In this element registration, the user interface has a function of setting the content of the element, ie, a partial image, a function of setting the type of element, and a function of setting layout and association between elements. In the element image setting function, the element is designated as a rectangular area in the document image, and a partial image of the area is cut out. As a result, elements can be changed or added. FIG. 4 is an explanatory diagram of a rectangle setting interface in a document image. On the display screen 400,
The image 401 of the entire page is displayed and a cut-out rectangle is set.
02 and a method of inputting coordinate values 411 and 412 in the coordinate setting window 410 using a keyboard can be used together. In the former method, an image of the entire page is displayed, the cursor on the display is moved, and the position coordinates are input. At this time, since the element image is represented by a rectangular area, the vertex 403 at the upper left corner of the rectangle is displayed.
And the vertex 404 at the lower right corner is set with the cursor and the coordinates are input.

【0018】また、登録済の要素の変更および削除を行
なう場合、複数の要素の中から対象となる要素を選択し
指定する必要がある。図5は文書要素の選択インタフェ
ースに用いる画面を示す。ディスプレイ画面500に表
示された文書501において、複数の要素510,51
1,512,513,514,515,516を矩形領
域で表示し、カーソル540を該当する矩形に移動さ
せ、マウスをクリックすることにより例えば、要素51
1を指定する。或いは、画面内の名称一覧ウィンドウ5
20において、要素に付けられた名称の一覧を表示し、
その名称の文字列530,531,532,533,5
34,535,536をカーソル541で指示すること
により該当する要素を指定する。要素が多数の場合は、
スクロールのための矢印521を指定することにより、
当該ウィンドウをスクロールする。図6は、要素画像の
縮小並びに拡大表示を説明する図である。上述のように
してマルチメディアファイルに登録した文書要素を表示
しユーザがファイルの内容を確認することは、ユーザイ
ンタフェースの実現において不可欠である。このため、
要素画像をディスプレイ上に表示する。ディスプレイの
解像度およびサイズの制約の点から、多数の要素画像を
ディスプレイ上に同時に表示することはできない。そこ
で、本図に示すように、デイスプレイ602において要
素画像603をそのまま表示する機能とともに、ディス
プレイ600に示すように要素画像601を縮小し表示
する機能を設けている。
When changing or deleting a registered element, it is necessary to select and specify a target element from a plurality of elements. FIG. 5 shows a screen used for a document element selection interface. In the document 501 displayed on the display screen 500, a plurality of elements 510, 51
1, 512, 513, 514, 515, and 516 are displayed in a rectangular area, the cursor 540 is moved to the corresponding rectangle, and the mouse is clicked to display, for example, the element 51.
Specify 1. Or, the name list window 5 in the screen
At 20, a list of names given to the elements is displayed,
Character strings 530,531,532,533,5 of the name
By pointing 34, 535, 536 with the cursor 541, the corresponding element is designated. If there are many elements,
By specifying the arrow 521 for scrolling,
Scroll the window. FIG. 6 is a diagram illustrating reduction and enlargement display of an element image. Displaying the document elements registered in the multimedia file as described above and allowing the user to check the contents of the file are indispensable in realizing the user interface. For this reason,
Display the element image on the display. Due to the limitations of display resolution and size, it is not possible to simultaneously display a large number of element images on the display. Therefore, as shown in this figure, a function of displaying the element image 603 as it is on the display 602 and a function of reducing and displaying the element image 601 as shown on the display 600 are provided.

【0019】文書要素の登録インタフェースとして、要
素の画像を文書画像から切り出して登録する操作、要素
間の関連性を付与する操作、登録結果の表示操作のそれ
ぞれの機能を具備している。文書画像の要素を登録する
操作は、ディスプレイ画面を介してカーソル及びマウ
ス、キーボードにより行なう。登録操作の種類として
は、要素の変更、追加、削除がある。図7は要素画像の
登録画面である。登録操作を対話的に行なうため、マル
チメディアファイルに既に登録されている要素は、本図
に示すように、部分画像としてディスプレイ画面700
に頁単位で表示する。ここでは、701に示すように文
書画像を画面に表示する。また、702に示すように要
素画像をテキスト710,712,713,715と図
表711,714にその種類を文字列等で区分して表示
するとともに、頁全体におけるそれぞれの要素の配置を
矩形領域で示す。さらに、図表の登録結果を確認するた
め、ディスプレイ720に示すように文書画像から図表
722、723分離して表示する。ここでは、文書画像
はその外枠のみが721に表示する機能を備えている。
画像登録のユーザインタフェースは文書一頁全体の原画
像を登録するモードと原画像の中から部分画像を登録す
るモードとからなる。文書一頁全体の原画像を登録する
画面においては、当該画面は例えば、左右のウィンドゥ
に分かれ、右のウィンドゥは属性ウィンドゥであり、原
画像の属性としてファイル名称、画像サイズ、画像の種
類を入力または表示する。この属性ウィンドゥの上部に
は、操作コマンドのメニューが表示されており、これら
の一つにカーソルをあわせ、マウスボタンをクリックす
ることにより操作コマンドが選択され実行する。操作コ
マンドとしては「登録」「表示」「一覧」「終了」「複
写」の各コマンドを備えている。この内、「登録」コマ
ンドは、原画像を新規にマルチメディアファイルに格納
するものである。また、「表示」コマンドは原画像を左
のウィンドゥに表示するものであり、ファイル名称を指
定することにより、原画像を表示する。「一覧」コマン
ドは既に登録している原画像のファイル名称のリストを
表示する。「複写」コマンドはディスプレイ画面のハー
ドコピーをとる。
The document element registration interface has functions of an operation of cutting out and registering an image of an element from a document image, an operation of giving a relationship between elements, and a display operation of a registration result. The operation of registering the elements of the document image is performed using a cursor, a mouse, and a keyboard via a display screen. Types of registration operation include change, addition, and deletion of an element. FIG. 7 is a registration screen of an element image. To perform the registration operation interactively, the elements already registered in the multimedia file are displayed on the display screen 700 as partial images as shown in FIG.
Is displayed in page units. Here, a document image is displayed on the screen as shown at 701. In addition, as shown in 702, the element images are displayed in texts 710, 712, 713, 715 and charts 711, 714 with their types classified by character strings and the like, and the arrangement of each element in the entire page is represented by a rectangular area. Show. Further, in order to confirm the registration result of the chart, the charts 722 and 723 are separated and displayed from the document image as shown on the display 720. Here, the document image has a function of displaying only the outer frame on the document image 721.
The user interface for image registration includes a mode for registering an original image of the entire document page and a mode for registering a partial image from the original image. In the screen for registering the original image of the entire page of the document, the screen is divided into, for example, left and right windows, the right window is an attribute window, and a file name, an image size, and an image type are input as attributes of the original image. Or display. At the top of the attribute window, a menu of operation commands is displayed. By moving the cursor to one of these and clicking the mouse button, the operation command is selected and executed. Operation commands include “registration”, “display”, “list”, “end”, and “copy” commands. Among them, the “register” command newly stores the original image in the multimedia file. The "display" command displays the original image in the left window, and displays the original image by specifying a file name. The “list” command displays a list of file names of the original images that have already been registered. The "copy" command makes a hard copy of the display screen.

【0020】文書全体の原画像から部分画像を登録する
ユーザインタフェースの画面においては、当該画面は例
えば、左右のウィンドゥに分かれ、左のウィンドゥには
登録した要素画像を赤線枠で表示する。また、右のウィ
ンドゥは属性ウィンドゥであり、部分画像のファイル名
称、間引き画像のファイル名称、間引き率等を入力、表
示する。この属性ウィンドゥの上部には、操作コマンド
のメニューが表示されており、操作コマンドとして、
「新規」「変更」「削除」「一覧」「終了」「複写」の
各コマンドを備えている。これらのコマンドの内、「新
規」コマンドは新たに部分画像をマルチメディアファイ
ルに登録する。また、「変更」コマンドは既に登録され
た部分画像の切り出し位置等を修正、変更する。「削
除」コマンドは登録されている部分画像を削除する。
「一覧」コマンドは登録されている部分画像のファイル
名称を表示する。要素画像の登録操作において、「変
更」コマンドの操作画面では、右上部にあるメニューか
ら「変更」コマンドを選択し、変更対象とする部分画像
にカーソルを移動させマウスをクリックすることにより
要素を選択指定する。画面の左のウィンドゥには指定し
た部分画像が赤色線枠で表示されており、その切り出し
位置をカーソルによって指定する。ここでは、変更した
切り出し位置を青色線枠で表示している。画面上部に
は、コマンドのメニューとして「確定」「複写」があ
り、変更した位置を目視で確認し「確定」コマンドを選
択することにより変更された要素画像がマルチメディア
ファイルに格納される。
In the screen of the user interface for registering a partial image from the original image of the entire document, the screen is divided into, for example, left and right windows, and the registered element images are displayed in a red window in the left window. The window on the right is an attribute window for inputting and displaying a file name of a partial image, a file name of a thinned image, a thinning rate, and the like. At the top of this attribute window, a menu of operation commands is displayed.
It has commands for "new", "change", "delete", "list", "end", and "copy". Among these commands, the “new” command newly registers a partial image in the multimedia file. The “change” command corrects and changes the cutout position and the like of the already registered partial image. The “delete” command deletes a registered partial image.
The “list” command displays the file names of the registered partial images. In the element image registration operation, on the operation screen of the "change" command, select the "change" command from the menu at the upper right, move the cursor to the partial image to be changed, and click the mouse to select the element specify. The specified partial image is displayed in a red line frame in the left window of the screen, and the cutout position is specified by the cursor. Here, the changed cutout position is indicated by a blue line frame. At the upper part of the screen, there are "confirmation" and "copy" as command menus. The changed position is visually confirmed, and the element image changed by selecting the "confirmation" command is stored in the multimedia file.

【0021】図8は文字行並びに文字の表示画面であ
る。ディスプレイ800において、文書の枠801を表
示するとともに、要素がテキストであるものに対して、
その文字行802,803,804を表示する。さら
に、文字ごとに分離したテキスト領域に対しては、ディ
スプレイ810に示すように、文書の枠811内におい
て分離した文字を矩形812,813,814,815
で表示している。
FIG. 8 shows a display screen for character lines and characters. On the display 800, a frame 801 of the document is displayed, and for a text element,
The character lines 802, 803, and 804 are displayed. Furthermore, for the text area separated for each character, as shown on the display 810, the separated characters in the frame 811 of the document are represented by rectangles 812, 813, 814, and 815.
Displayed with.

【0022】図9は要素画像の登録のための操作を説明
する図である。要素画像の登録操作のうち、変更操作で
は、矩形で表示されている要素画像の切り出し位置を変
更する。このため、本図に示すように、先ず、ディスプ
レイ画面900に縮小表示された文書画像901におい
て、要素画像903,904のなかから注目している要
素画像904を選択する。要素画像は矩形で表示されて
いるため、ここでは、画面上の矩形内にカーソルを設定
することによって、注目する要素を指示する。そして、
新たに要素の切り出し位置として、矩形の左上隅と右下
隅の位置をカーソルで設定する。また、要素画像の名
称、レイアウトの名称、要素の種類等をキーボードから
修正入力する。また、追加操作では、新規にマルチメデ
ィアファイルに要素画像を登録することになる。従っ
て、ディスプレイ画面に表示されている文書の頁全体の
画像から、カーソルにより要素の切り出し位置を新たに
設定するとともに、要素画像の名称、レイアウトの名
称、要素の種類等をキーボードから新規に入力する。さ
らに、削除操作では、ディスプレイ画面に表示された要
素画像のなかから注目している要素画像をカーソルによ
って選択し、削除処理を実行する。なお、変更及び追加
操作では、要素画像が登録されると同時に、要素画像の
縮小画像を生成し、同じくマルチメディアファイルに登
録する。文書画像を拡大表示して、長方形領域の変更、
追加、削除を行うこともでき、ディスプレイ910、9
20において拡大した文書画像911、921を表示
し、文字行912、913、914、915あるいは、
文字921,922,923,924、930,931
に対して、同様に、登録操作を行う機能を備えている。
FIG. 9 is a diagram for explaining an operation for registering an element image. In the change operation of the element image registration operation, the cutout position of the element image displayed in a rectangle is changed. For this reason, as shown in this figure, first, in the document image 901 reduced and displayed on the display screen 900, the element image 904 of interest is selected from the element images 903 and 904. Since the element image is displayed as a rectangle, a cursor is set in the rectangle on the screen to specify a target element. And
The position of the upper left corner and the lower right corner of the rectangle is set as a new element cutout position with the cursor. The name of the element image, the name of the layout, the type of the element, and the like are corrected and input from the keyboard. In addition, the element image is newly registered in the multimedia file by the adding operation. Therefore, from the image of the entire page of the document displayed on the display screen, the cutout position of the element is newly set by the cursor, and the name of the element image, the name of the layout, the type of the element, etc. are newly input from the keyboard. . Further, in the deletion operation, the element image of interest is selected by the cursor from the element images displayed on the display screen, and the deletion processing is executed. In the change and addition operations, at the same time as the element images are registered, reduced images of the element images are generated and registered in the multimedia file. Enlarge the document image to change the rectangular area,
Additions and deletions can be made, and the displays 910, 9
20, the enlarged document images 911 and 921 are displayed, and character lines 912, 913, 914 and 915 or
Characters 921, 922, 923, 924, 930, 931
, A function of performing a registration operation.

【0023】図10は要素のレイアウト名称を登録する
インタフェースを説明する図である。ディスプレイ10
00において、文書画像1001を表示し、この文書画
像内に矩形領域を設定するとともに、矩形に対して名称
をキー入力することができる。例えば、矩形領域100
2に名称としてタイトルを付与する。また、矩形領域1
005に対して名称として要約を付与する。
FIG. 10 is a view for explaining an interface for registering layout names of elements. Display 10
At 00, the document image 1001 is displayed, a rectangular area can be set in the document image, and the name of the rectangle can be input by key. For example, the rectangular area 100
2 is given a title as a name. Also, the rectangular area 1
A summary is given to 005 as a name.

【0024】図11はレイアウトの表示画面の説明図で
ある。本図に示すように、ディスプレイ1100では、
文書一頁1101の要素のレイアウトを示しており、デ
ィスプレイ画面1100に全体が表示できるよう縮小し
て表示する。ここでは、テキスト領域1110におい
て、論理構造を矩形の入れ子形式で表示する機能を備え
ており、例えば、1章の領域1111に対して、章のタ
イトル矩形1120と節の矩形1121,1123が表
示される。そして、節の内部に節のタイトルの矩形11
22,1123等を表示するような入れ子形式である。
これらの縮小した要素画像は、当該要素を選択し指定す
ることにより、ディスプレイ1130に示すように、拡
大した文書画像の一部1131を表示するとともに、要
素画像1141を表示することもできる。
FIG. 11 is an explanatory diagram of a layout display screen. As shown in the figure, in the display 1100,
The layout of the elements of one page 1101 of the document is shown, and is reduced and displayed on the display screen 1100 so that the whole can be displayed. Here, the text area 1110 has a function of displaying a logical structure in a rectangular nested format. For example, a chapter title rectangle 1120 and section rectangles 1121 and 1123 are displayed in a chapter area 1111. You. Then, within the section, a rectangle 11 of the title of the section
22, 1123 etc. are displayed in a nested format.
By selecting and designating these reduced element images, as shown on the display 1130, a part 1131 of the enlarged document image can be displayed and the element image 1141 can be displayed.

【0025】図12は、関連性の登録操作を説明する図
である。ディスプレイ1200において、文書画像12
01の内部にある複数の要素1202,1203或いは
1204,1205を選択し、関連性を付与してマルチ
メディアファイルに登録する。関連する要素として、テ
キストとテキストとの間のリンク、テキストと図表との
間のリンク、図表間のリンクがある。ここでは、図表の
要素1202とテキストの要素1203の間において関
連性を付与する操作を述べる。登録されている要素画像
は、ディスプレイ画面1200にレイアウトを保持した
形式で表示されるとともに、要素の種類も表示される。
要素の種類の表示としては、例えば、テキストの要素は
青色の矩形で囲まれ表示され、一方、図表の要素は赤色
の矩形で囲まれ表示される。関係付けは対となる二つの
要素を指定することにより実行される。対となる要素
は、カーソルを矩形内に設定することによって選択す
る。関係付けは要素1212と要素1213をつなぐ線
分1220で表示する。ディスプレイ1211では、こ
のようにして、関係付けられた二つの要素の間は線分1
220,1221で結ばれている。
FIG. 12 is a diagram for explaining the operation of registering the association. On the display 1200, the document image 12
01, a plurality of elements 1202, 1203 or 1204, 1205 are selected, added to the association, and registered in the multimedia file. Related elements include a link between text and text, a link between text and chart, and a link between charts. Here, an operation for giving a relationship between the diagram element 1202 and the text element 1203 will be described. The registered element images are displayed on the display screen 1200 in a format retaining the layout, and the types of the elements are also displayed.
As the display of the type of the element, for example, the element of the text is displayed by being surrounded by a blue rectangle, while the element of the chart is displayed by being surrounded by a red rectangle. The association is performed by specifying two pairs of elements. The element to be paired is selected by setting the cursor within the rectangle. The association is displayed by a line segment 1220 connecting the element 1212 and the element 1213. In the display 1211, the line segment 1 is located between the two elements related to each other.
220 and 1221 are connected.

【0026】本実施例では、登録結果の一覧表示の機能
を備えており、これにより、要素登録の誤りを少なく
し、データとしての信頼性を高めることができる。図1
3は要素の一覧表示画面の表示方法を説明する図であ
る。この一覧表示は、ディスプレイ画面1300に登録
した結果を表示し、登録内容の検査を画面を眺めながら
行なう。このため、登録のユーザインタフェースでは、
マルチメディアファイルに格納された要素画像をディス
プレイ画面に一覧表示し、登録した要素を目視により確
認できる。要素画像の数は多数になるため、ディスプレ
イ画面に同時に複数の要素画像を表示する。さらに、画
面をめくることにより、要素画像を順次表示する。ここ
では、一つのディスプレイ画面1300に要素画像を多
数配置して表示するため、図13に示すように、要素画
像の縮小画像1301,1302,1303,130
4,1305,1306,1307,1308,130
9,1310を表示する。このような縮小画像を表示す
ることにより要素の概略を確認することができるととも
に、多数の要素画像を一時に確認することができる。さ
らに、要素画像の内容を詳細に確認する場合には、画面
1300に配置された要素画像の一つを選択することに
より、その要素画像を拡大した画像1321が画面13
20に表示される。また、この拡大した画像1321を
表示するとともに、先に関連付けされた要素画像、例え
ば図の説明文1322も併せて表示する。
In the present embodiment, a function of displaying a list of registration results is provided, whereby errors in element registration can be reduced and the reliability as data can be improved. FIG.
FIG. 3 is a diagram illustrating a method of displaying an element list display screen. In this list display, the registered result is displayed on the display screen 1300, and the registered contents are inspected while looking at the screen. For this reason, in the registration user interface,
A list of element images stored in the multimedia file is displayed on a display screen, and registered elements can be visually confirmed. Since the number of element images is large, a plurality of element images are simultaneously displayed on the display screen. Further, by turning the screen, the element images are sequentially displayed. Here, since a large number of element images are arranged and displayed on one display screen 1300, reduced images 1301, 1302, 1303, and 1303 of the element images are displayed as shown in FIG.
4,1305,1306,1307,1308,130
9, 1310 are displayed. By displaying such reduced images, it is possible to check the outline of the elements and to check a large number of element images at a time. Further, when the content of the element image is to be checked in detail, by selecting one of the element images arranged on the screen 1300, an image 1321 obtained by enlarging the element image is displayed on the screen 1330.
20 is displayed. In addition to displaying the enlarged image 1321, an element image previously associated with the image, for example, a legend 1322 in the figure is also displayed.

【0027】図14は、マルチメディアファイルの構成
の説明図である。マルチメディアファイルには、同図に
示すように、文書画像データ1401とこれらの画像デ
ータへのアクセスを制御する制御データ1400が格納
される。文書画像データ1401は、文書一頁全体の画
像データ(原画像データ)1402と、要素である部分
画像データ1403とからなる。さらに、これらの画像
データを登録時に縮小した縮小画像データ1404も備
えている。画像のデータ形式は、データ圧縮の有無によ
り非圧縮或いは圧縮データとして格納される。また、画
像は単色のスキャナで採取したモノクロデータ或いはカ
ラースキャナで採取した三原色成分を有するカラーデー
タを扱える。さらに、これらの画素値は、8ビットの濃
淡値または1ビットの2値データとして表現される。
FIG. 14 is an explanatory diagram of the structure of a multimedia file. As shown in the figure, document data 1401 and control data 1400 for controlling access to these image data are stored in the multimedia file. The document image data 1401 includes image data (original image data) 1402 of one entire page of a document and partial image data 1403 as an element. Furthermore, reduced image data 1404 obtained by reducing these image data at the time of registration is also provided. The data format of the image is stored as uncompressed or compressed data depending on the presence or absence of data compression. The image can handle monochrome data collected by a single-color scanner or color data having three primary color components collected by a color scanner. Further, these pixel values are expressed as 8-bit grayscale values or 1-bit binary data.

【0028】図15は、画像データを制御する制御デー
タの形式を説明する図である。制御データ1400は、
原画像ファイルデータ1500、部分画像ファイルデー
タ1501、レイアウトデータ1502、関係データ1
503、文字行データ、文字データ等からなる。これら
のデータは2バイトのヘッダ部にデータの種類を示す番
号1510,1520,1530,1540を備えてお
り、この種類番号により制御データを識別している。原
画像ファイルデータ1500には、文書一頁の画像に関
する制御情報を備えており、原画像を指定するための原
画像番号1511、原画像が格納されているファイルの
名称1513、原画像の横および縦のサイズ1515,
1516がある。部分画像ファイルデータ1501は、
原画像から切り出した部分画像に関する制御情報を備え
ており、この制御データとしては元の原画像を示す原画
像番号1521、部分画像が格納されているファイルの
名称1526、部分画像の横および縦のサイズ152
7,1528がある。レイアウトデータ1502は、部
分画像ファイルデータ1501とリンクされて格納され
ており、文書一頁における部分画像を示す矩形の位置座
標1534,1535,1536,1537を有してい
る。また、レイアウトの種類1532は要素がテキスト
或いは図表のいづれであるかを示す。関係データ150
3は関連を有する要素を示しており、二つの要素のレイ
アウト番号1541,1542でこの関連性を表現して
いる。文字行データ及び文字データはレイアウトデータ
と同じく、文書一頁における文字行および文字を示す矩
形の位置座標を有している。
FIG. 15 is a view for explaining the format of control data for controlling image data. The control data 1400 is
Original image file data 1500, partial image file data 1501, layout data 1502, relational data 1
503, character line data, character data, and the like. These data are provided with numbers 1510, 1520, 1530, and 1540 indicating the type of data in a 2-byte header portion, and control data is identified by the type number. The original image file data 1500 includes control information relating to the image of one page of the document, and includes an original image number 1511 for designating the original image, a file name 1513 in which the original image is stored, a horizontal image of the original image, Vertical size 1515,
There are 1516. The partial image file data 1501 is
The control information about the partial image cut out from the original image is provided. The control data includes an original image number 1521 indicating the original original image, a file name 1526 storing the partial image, and horizontal and vertical Size 152
7,1528. The layout data 1502 is linked with the partial image file data 1501 and stored, and has rectangular position coordinates 1534, 1535, 1536, and 1537 indicating a partial image on one page of the document. The layout type 1532 indicates whether the element is a text or a chart. Relational data 150
Reference numeral 3 denotes an element having a relation, and the relation is expressed by layout numbers 1541 and 1542 of the two elements. Like the layout data, the character line data and the character data have rectangular position coordinates indicating the character line and the character on one page of the document.

【0029】検索システムでは、文書画像を入力し、そ
の構成要素を光ディスク等のマルチメディアファイルに
登録する。登録操作はワークステーション上でマウス、
キーボードを用いて対話的に行なう。このため、このワ
ークステーションには文書画像を表示するためカラーC
RTを有するディスプレイ装置を備えている。また、ワ
ークステーションには、磁気ディスクと書替え型光ディ
スクが接続されており、マルチメディアファイルを構成
しており、文書の全体画像及び部分画像を格納してい
る。さらに、文書画像の入力用としてモノクロスキャナ
およびカラースキャナが使用できる。要素画像の登録を
行なうユーザインタフェースのソフトウェア構成は、全
体制御部はユーザインタフェースの全体の処理を制御す
る。その下にあるファイル入出力部、原画像登録部、要
素画像の変更・追加・削除部、要素の表示部から構成さ
れている。さらに、これらの処理部に共通なルーチンと
して、全体画像ならびに部分画像を表示する画像表示
部、原画像から部分画像を切出したり縮小した間引き画
像を生成する画像データ生成部、画面上に窓枠を生成し
たりキーボードからのコマンドを制御するウィンドゥ制
御部がある。
In the search system, a document image is input, and its components are registered in a multimedia file such as an optical disk. To register, use the mouse on the workstation,
Perform interactively using the keyboard. Therefore, this workstation has a color C for displaying a document image.
A display device having an RT is provided. A magnetic disk and a rewritable optical disk are connected to the workstation, constitute a multimedia file, and store an entire image and a partial image of a document. Further, a monochrome scanner and a color scanner can be used for inputting a document image. In the software configuration of the user interface for registering the element images, the overall control unit controls the entire processing of the user interface. It consists of a file input / output unit, original image registration unit, element image change / addition / deletion unit, and element display unit thereunder. Furthermore, as routines common to these processing units, an image display unit that displays the entire image and the partial image, an image data generation unit that generates a thinned image obtained by cutting out or reducing the partial image from the original image, and a window frame on the screen. There is a window control that generates and controls commands from the keyboard.

【0030】図16は要素画像に対する検索の説明図で
ある。検索は2段階の処理になっており、文字列検索と
拾い読み検索とからなる。この検索では、先ず、文書画
像から分離抽出した図表等の要素画像の集合1600に
対して、通常の文字列検索によって、所望の要素画像の
候補を絞り込む。要素画像1601,1602,160
3,1604,1605,1606には、それぞれキー
ワード1611,1612,1613,1614,16
15,1616が付与されている。絞り込まれた要素画
像の集合1620は、文字列検索に用いたキーワードに
よって、グループ1621,1622,1623に区分
される。ここでは、この文字列検索のために予めキーワ
ードが付与されている。このキーワードを基に文字列検
索を行い、候補である要素画像の集合を得る。要素画像
には図表のキャプションがありこれが文字列検索の手掛
かりになる。この要素画像の集合であるグループ、例え
ば1622に対して、次いで、ディスプレイ画面165
0を介して対話的に拾い読みを行い、所望の要素画像を
探索する。この時、フルカラーの要素画像に対するブラ
ウジングの待ち時間を短くするためには、フレームメモ
リ1641にフレーム画像1642,1643,164
4を格納しておく。フレーム画像は、当該要素画像16
32,1633から生成する。フレームメモリ1641
に格納されたフレーム画像を順次、ディスプレイ画面1
650のウィンドウ1651に表示する。
FIG. 16 is an explanatory diagram of a search for an element image. The search is a two-stage process, which includes a character string search and a browse search. In this search, first, desired element image candidates are narrowed down by a normal character string search for a set 1600 of element images such as charts and the like separated and extracted from the document image. Element images 1601, 1602, 160
3, 1604, 1605, and 1606 include keywords 1611, 1612, 1613, 1614, and 16 respectively.
15, 1616 are provided. The set 1620 of the narrowed-down element images is divided into groups 1621, 1622, and 1623 according to the keyword used for the character string search. Here, a keyword is assigned in advance for this character string search. A character string search is performed based on the keyword to obtain a set of candidate element images. Element images have captions for figures and tables, which can be used as clues for character string searches. For this group of element images, for example 1622, then the display screen 165
0 to interactively browse and search for a desired element image. At this time, in order to reduce the waiting time for browsing the full-color element images, the frame images 1642, 1643, and 164 are stored in the frame memory 1641.
4 is stored. The frame image is the element image 16
32, 1633. Frame memory 1641
Sequentially display the frame images stored in the display screen 1
650 in the window 1651.

【0031】図17は、文書要素画像の高速ブラウジン
グのための構成図である。文書の要素画像1701を高
速にブラウジングするためのフレームメモリ1702を
備えているフレームメモリ1702はワークステーショ
ン1700とバスで接続されており、ワークステーショ
ン1700では、要素画像が文書画像から分離抽出さ
れ、フレームメモリ1702に送られ、フレーム画像と
して蓄積される。ワークステーション1700からはフ
レーム番号を指定することによりフレームメモリ170
2にアクセスしており、これによりフレーム画像をビデ
オ信号として出力することができる。また、スーパイン
ポーズ装置1703では、ワークステーション1700
のディスプレイ用のビデオ信号とフレーム画像のビデオ
信号とが合成され、この合成されたビデオ信号がディス
プレイ装置1704に表示される。ディスプレイ装置1
704には、要素画像を表示するためのウィンドゥ17
05と、検索の操作を行うウィンドゥ1706が用意さ
れている。この要素画像表示ウィンドゥ1704に、順
次、要素画像が高速に順方向または逆方向に送られて、
或いは、静止して表示される。一方、検索の操作を行う
ウィンドゥ1706では、文字列検索および拾い読み検
索を実行する。
FIG. 17 is a configuration diagram for high-speed browsing of a document element image. The frame memory 1702 includes a frame memory 1702 for browsing the document element image 1701 at high speed. The frame memory 1702 is connected to the workstation 1700 by a bus. In the workstation 1700, the element image is separated and extracted from the document image. The data is sent to the memory 1702 and stored as a frame image. From the workstation 1700, the frame memory 170 is designated by specifying the frame number.
2 is accessed, so that a frame image can be output as a video signal. In the superimposing device 1703, the workstation 1700
Are combined with the video signal of the frame image, and the combined video signal is displayed on the display device 1704. Display device 1
A window 704 displays an element image.
05 and a window 1706 for performing a search operation. The element images are sequentially sent to the element image display window 1704 at high speed in the forward or reverse direction.
Alternatively, it is displayed stationary. On the other hand, a window 1706 for performing a search operation executes a character string search and a browse search.

【0032】図18は、文書要素画像に対する内容検索
の処理手順である。処理の手順は、先ず、ステップ18
00において要素画像をフレームメモリに入力するとと
もに、ステップ1801でそれぞれの要素画像に対する
検索属性を検索属性ファイルに格納する。ここでは、検
索属性として、図表等のキャプションの文字列を予め文
字認識技術によって分離抽出して利用する。次いで、検
索の処理過程に移り、先ず、通常の文字列検索を行う
が、この時、ステップ1802でユーザは検索用の文字
列をキーワードとして指定する。ステップ1803で文
字列検索を実行し、ステップ1804で該当する要素画
像の識別子を文字列検索の検索結果として格納し、一つ
のグループを形成する。このグループに属する要素画像
が、次のステップ1805で拾い読み検索の範囲として
設定される。多数の要素画像をすべて拾い読みするので
はなく、この文字列検索によって、拾い読みをする要素
画像の絞り込みを行うことになる。もちろん、文字列検
索を省略して、すべての要素画像を順次拾い読みするこ
ともできる。ステップ1806の拾い読み検索の実行
は、画面を介して対話的に行う。拾い読みは、高速表示
及び低速表示の両方を用いて目視で探索し、所望の要素
画像を見付ける。所望の要素画像を見付けた時点で、静
止表示のモードに切り換え、検索結果として保存するた
めに、ステップ1807でハードコピーを取る等の操作
を行う。
FIG. 18 shows a processing procedure for content search for a document element image. The processing procedure is as follows:
At 00, the element images are input to the frame memory, and at step 1801, the search attributes for each element image are stored in the search attribute file. Here, a character string of a caption such as a chart is separated and extracted in advance by a character recognition technique and used as a search attribute. Next, the process proceeds to a search process. First, a normal character string search is performed. At this time, in step 1802, the user specifies a character string for search as a keyword. In step 1803, a character string search is executed, and in step 1804, the identifier of the corresponding element image is stored as a search result of the character string search to form one group. In the next step 1805, the element images belonging to this group are set as the range of the browse search. Instead of browsing through a large number of element images, this character string search narrows down the element images to be browsed. Of course, the character string search can be omitted and all the element images can be sequentially browsed. Execution of the browse search in step 1806 is performed interactively via a screen. The browsing is performed by visually searching using both the high-speed display and the low-speed display to find a desired element image. When a desired element image is found, the mode is switched to the still image display mode, and an operation such as taking a hard copy in step 1807 is performed to save the image as a search result.

【0033】図19は、内容検索を行うためのワークス
テーションの表示画面の説明図である。画面1900の
内部には、要素画像を順次表示する要素画像表示ウィン
ドゥ1901と、検索の対話的な操作を行う検索操作ウ
ィンドゥ1902がある。表示画面1900のサイズ
は、横1280画素×縦1024画素である。また、要
素画像表示ウィンドゥ1901のサイズは、横640画
素×縦512画素の固定であるが、このサイズは、フレ
ーム画像のサイズに合致している。文書画像から分離抽
出した要素画像は、そのサイズが様々であり、従って、
要素画像表示ウィンドゥのサイズに合わせるため、画像
の拡大、縮小及び余白部の埋め込みの処理を行ってい
る。
FIG. 19 is an explanatory diagram of a display screen of a workstation for performing a content search. The screen 1900 includes an element image display window 1901 for sequentially displaying element images, and a search operation window 1902 for performing an interactive search operation. The size of the display screen 1900 is 1280 (horizontal) × 1024 (vertical) pixels. The size of the element image display window 1901 is fixed at 640 pixels horizontally × 512 pixels vertically, but this size matches the size of the frame image. Element images separated and extracted from document images have various sizes, and therefore,
In order to match the size of the element image display window, processing of enlarging and reducing an image and embedding a margin is performed.

【0034】カラー文書画像より図や写真等の要素画像
を分離し、検索のための手掛かりとなる属性と、要素画
像データを登録する。要素画像は、長方形領域として文
書画像から抽出される。要素画像は、画面を介して高速
に表示できるようにフレームメモリに格納される。様々
な大きさの図表が文書には掲載されているため、要素画
像をフレームメモリに格納する際に、横640画素×縦
512画素のフレーム画像のサイズに要素画像のサイズ
を合わせる。図20にフレーム画像の生成手順を示す。
この手順は、先ず、ステップ2000で文書画像を入力
し、ステップ2001で要素画像を分離する。分離した
要素画像のサイズを、フレーム画像のサイズに合わせる
ため、ステップ2002で要素画像の拡大、縮小を行
う。そして、ステップ2003でフレーム画像へ要素画
像を入力する。この時、要素画像の歪がないよう、拡大
率、縮小率を縦、横とも同じ値としており、フレーム画
像の縦、又は横のサイズのいずれかに合わせることにな
り、余白部が発生する。このため、ステップ2004で
余白部を例えば、白色の画素で埋め込みフレーム画像を
生成する。なお、簡単のため、拡大率、縮小率を整数及
びその逆数としてもよい。次いで、ステップ2005で
フレーム画像を出力する。
Element images such as figures and photographs are separated from a color document image, and attributes serving as clues for retrieval and element image data are registered. The element image is extracted from the document image as a rectangular area. The element images are stored in the frame memory so that they can be displayed at high speed via the screen. Since figures and tables of various sizes are described in the document, when storing the element image in the frame memory, the size of the element image is adjusted to the size of the frame image of 640 pixels (width) × 512 pixels (height). FIG. 20 shows a procedure for generating a frame image.
In this procedure, first, a document image is input in step 2000, and element images are separated in step 2001. In order to match the size of the separated element image with the size of the frame image, in step 2002, the element image is enlarged or reduced. Then, in step 2003, the element image is input to the frame image. At this time, the enlargement ratio and the reduction ratio are set to the same value in both the vertical and horizontal directions so that the element image is not distorted. For this reason, in step 2004, an embedded frame image is generated in a blank portion using, for example, white pixels. For simplicity, the enlargement ratio and the reduction ratio may be integers and their reciprocals. Next, in step 2005, a frame image is output.

【0035】図21は、文書要素画像の処理過程の説明
図である。文書画像2100の内部の要素画像、例え
ば、図中の黒線枠で示す写真領域2101を先ず,分離
処理部2102で分離する。そして、その要素画像21
03から、拡大、縮小処理部2104で拡大、縮小画像
2105を生成する。なお、縮小処理では、画素の値を
平均化する方法で実現している。そして、埋め込み処理
部2107において、余白部2110を特定の値を有す
る画素データで埋め込み、横640画素×縦512画素
のフレーム画像2108を生成する。なお、登録する要
素画像を画面に表示させ、画面をみながらガンマ補正
(濃度の補正)ができ、ガンマ補正後の画像を要素画像
としてフレームメモリに格納する。
FIG. 21 is an explanatory diagram of a process of processing a document element image. First, a separation processing unit 2102 separates an element image inside the document image 2100, for example, a photographic area 2101 indicated by a black line frame in the figure. Then, the element image 21
From 03, an enlargement / reduction processing unit 2104 generates an enlargement / reduction image 2105. Note that the reduction processing is realized by a method of averaging pixel values. Then, the embedding processing unit 2107 embeds the margin 2110 with pixel data having a specific value, and generates a frame image 2108 of 640 pixels horizontally × 512 pixels vertically. The element image to be registered is displayed on the screen, gamma correction (density correction) can be performed while looking at the screen, and the image after the gamma correction is stored in the frame memory as the element image.

【0036】文書要素画像の登録は、文書画像を画面に
表示するとともに、自動的に分離した要素画像を長方形
領域で表示する。また、対話的に要素画像を分離抽出す
ることもでき、図表等の要素画像に対して、マウスで長
方形領域の左上点と右下点とを指定して切り出す。切り
出した画像を要素画像として、属性情報を付与して登録
する。この登録の操作は、編集可能とし、登録した要素
画像の削除、新規生成、位置の変更等ができる。図22
に文書要素画像の登録操作の手順を示す。ステップ22
00において、画面の表示されているメニューコマンド
を選択して、ステップ2220以下の登録操作を行う。
操作は、「新規」2201、「削除」2202、「変
更」2203、「一覧」2204、「複写」2205、
「終了」2206からなる。例えば、「新規」2201
のメニューコマンドを選択すると、ステップ2210の
座標入力の処理過程に移り、画面上の長方形領域の座標
を順次入力し、ステップ2211で、それらの値を登録
する。また、「削除」2202のメニューコマンドで
は、ステップ2212でカーソルで登録済の要素画像を
指定し、ステップ2213で当該要素画像の削除を実行
する。「複写」2205のコマンドでは、ステップ22
17で登録画面のフルカラーのハードコピーをとること
ができる。
In registering the document element image, the document image is displayed on the screen, and the automatically separated element image is displayed in a rectangular area. Also, element images can be separated and extracted interactively, and an element image such as a chart is specified and cut out with the mouse at the upper left point and the lower right point of the rectangular area. The cut-out image is registered as attribute images with attribute information. This registration operation is editable, and the registered element image can be deleted, newly generated, the position can be changed, and the like. FIG.
Shows the procedure for registering a document element image. Step 22
At 00, a menu command displayed on the screen is selected, and a registration operation from step 2220 is performed.
The operations are "new" 2201, "delete" 2202, "change" 2203, "list" 2204, "copy" 2205,
"End" 2206 is included. For example, "new" 2201
When the menu command is selected, the process proceeds to the process of inputting coordinates in step 2210, and the coordinates of the rectangular area on the screen are sequentially input. In step 2211, those values are registered. In the menu command of “delete” 2202, the registered element image is designated by the cursor in step 2212, and the element image is deleted in step 2213. In the command of “copy” 2205, step 22
At 17, a full color hard copy of the registration screen can be taken.

【0037】要素画像に付与されている文字列を手掛か
りにして、通常のキーワード検索を行う。該当する要素
画像の集合をグループとして登録する。例えば、今、説
明のために要素画像をe1,e2,e3,e4,e5,
e6とする。キーワード検索によって、複数のグループ
を生成したとし、そのグループをG1,G2,G3とす
る。ここで、キーワードkey1によって求められた要
素画像はe1,e2,e4であり、これらをグループG
1としている。同じく、キーワードkey2によって求
められたグループG2の要素画像をe3,e5、グルー
プG3の要素画像をe6とする。要素画像のブラウジン
グでは、グループごとに要素画像を画面に順次表示し、
目的の要素画像を目視で見付ける。この時、画面に要素
画像を表示するその表示順序は、キーワード検索におい
て、合致の程度によって順位を決めることとし、例え
ば、グループG1は、要素画像の表示を、e2,e4,
e1の順で行うことができる。ここで、説明のため、キ
ーワード検索の合致の程度が要素画像e2が高位にあっ
たとしている。また、単純に、表示の順序は文字列検索
によって求められた順番とすることもできる。
Using the character string assigned to the element image as a clue, a normal keyword search is performed. A set of corresponding element images is registered as a group. For example, for the sake of simplicity, element images are now described as e1, e2, e3, e4, e5.
e6. Assume that a plurality of groups are generated by keyword search, and the groups are G1, G2, and G3. Here, the element images obtained by the keyword key1 are e1, e2, and e4, and these are group G
It is set to 1. Similarly, the element images of the group G2 obtained by the keyword key2 are e3 and e5, and the element images of the group G3 are e6. When browsing element images, element images are displayed on the screen for each group in order,
Visually find the desired element image. At this time, the order in which the element images are displayed on the screen is determined according to the degree of matching in the keyword search. For example, the group G1 displays the element images e2, e4
It can be performed in the order of e1. Here, for the sake of explanation, it is assumed that the degree of matching in the keyword search is higher for the element image e2. Further, the display order can be simply the order obtained by the character string search.

【0038】このグループ情報の登録では、要素画像の
登録の画面とは別に、新規作成、変更、削除等の編集が
できる。この操作は、先ず、グループ番号を指定する
と、該当するグループに属する表示順序番号とフレーム
番号の一覧が表示される。変更では、フレーム番号を選
択また入力するとともに、表示順序番号を入力し、実行
すると変更個所が登録され、設定したグループにおける
表示順序番号とフレーム番号の一覧が再表示される。新
規作成では、フレーム番号を入力し、次いで、表示順序
番号を入力し、同じように、実行すると登録され、設定
したグループにおける表示順序番号とフレーム番号の一
覧が再表示される。削除では、フレーム番号を選択また
入力し、実行すると削除され、設定したグループにおけ
る表示順序番号とフレーム番号の一覧が再表示される。
なお、表示順序番号の整列のため、表示順序番号につい
ては、入力時、すでに登録されている同一の番号を設定
した場合、先に設定されている番号を優先とし、再表示
時に番号を付け直す。また、グループに属していない要
素画像の扱いについては、これらグループが設定されて
いない要素画像に対して、グループ番号0を指定するこ
とによってアクセスし、編集できる。さらに、登録した
要素画像を表示による確認するため、フレーム番号を入
力することにより、該当する要素画像が画面に表示され
る。
In the registration of the group information, editing such as new creation, change, and deletion can be performed separately from the screen for registering the element images. In this operation, first, when a group number is specified, a list of display order numbers and frame numbers belonging to the corresponding group is displayed. In the change, a frame number is selected and input, and a display order number is input. When executed, a changed portion is registered, and a list of display order numbers and frame numbers in the set group is displayed again. In the new creation, a frame number is input, and then a display order number is input. Similarly, when execution is performed, the display is registered and the list of display order numbers and frame numbers in the set group is displayed again. In the deletion, a frame number is selected and input, and when executed, the frame number is deleted, and a list of display order numbers and frame numbers in the set group is displayed again.
In order to arrange the display order numbers, when the display order numbers are set to the same registered numbers at the time of input, the previously set numbers are prioritized, and the numbers are renumbered at the time of redisplay. . Regarding the handling of element images that do not belong to a group, element images for which these groups are not set can be accessed and edited by designating a group number 0. Further, in order to confirm the registered element image by display, the corresponding element image is displayed on the screen by inputting a frame number.

【0039】図23は、文書要素画像のブラウジングの
説明図である。要素画像を拡大、縮小したフレーム画像
2300,2301,2302,2303を単位にフレ
ームメモリにアクセスし、検索画面に表示する。表示
は、順方向にフレーム画像を続けて表示する順方向表示
2310と、逆方向に表示する逆方向表示2311があ
る。また、ある特定のフレーム画像を画面に静止させて
表示する停止表示2312がある。ブラウジングの操作
は、フレーム画像を順方向に表示し、順次目標のフレー
ム画像をユーザが目視で探す。そして、該当するフレー
ムメモリをユーザが見付けたとき、停止表示に切り換え
る。この切り換えは、ユーザがファンクションキーを押
すことによりおこない、停止表示の状態でフレーム画像
を詳細にユーザが観察できる。また、順方向の表示が行
き過ぎた場合、フレーム画像を元に戻ることができるよ
う逆方向表示の機能を設けている。ここでは、表示する
フレーム画像が尽きた場合、新ためて最初のフレーム画
像から表示し、表示を連続して行うようにしている。
FIG. 23 is an explanatory diagram of browsing of document element images. The frame memory is accessed in units of frame images 2300, 2301, 2302, and 2303 obtained by enlarging and reducing the element images, and displayed on the search screen. The display includes a forward display 2310 for continuously displaying frame images in the forward direction and a backward display 2311 for displaying in the reverse direction. In addition, there is a stop display 2312 for displaying a certain specific frame image on the screen stationary. In the browsing operation, a frame image is displayed in a forward direction, and a user sequentially looks for a target frame image visually. When the user finds the corresponding frame memory, the display is switched to the stop display. This switching is performed by the user pressing a function key, and the user can observe the frame image in detail in a stopped display state. In addition, a reverse display function is provided so that the frame image can be returned to the original state when the display in the forward direction is excessive. Here, when the frame images to be displayed are exhausted, a new frame image is displayed from the first frame image, and the display is performed continuously.

【0040】図24は、文書要素画像の表示モードの切
り換え手順の説明図である。フレーム画像の表示の速度
は、1/30秒単位に、任意の速度に切り替えることが
できる。ここでは、要素画像のブラウジングのため、高
速表示モードと低速表示モードを備えている。要素画像
の表示モードの切り換えを行うため、ステップ2400
でユーザが押したファンクションキーを読み取り行う。
次いで、ステップ2401で表示モードを切り換える。
高速モード2402では、ステップ2410で高速表示
となり、1秒間に5枚のフレーム画像を表示する。低速
モード2403では、低速表示となり、1秒間に1枚の
速度で表示する。停止モード2404では、停止表示2
414となりフレーム画像を詳細にユーザが観察でき
る。
FIG. 24 is an explanatory diagram of the procedure for switching the display mode of the document element image. The display speed of the frame image can be switched to an arbitrary speed in units of 1/30 seconds. Here, a high-speed display mode and a low-speed display mode are provided for browsing element images. Step 2400 for switching the display mode of the element image.
The function key pressed by the user is read with.
Next, in step 2401, the display mode is switched.
In the high-speed mode 2402, high-speed display is performed in step 2410, and five frame images are displayed per second. In the low-speed mode 2403, low-speed display is performed, and display is performed at a speed of one sheet per second. In the stop mode 2404, the stop display 2
At 414, the user can observe the frame image in detail.

【0041】フレームメモリは、フレーム画像が多数枚
格納できる構成になっている。各フレーム画像にはフレ
ーム番号が付けられており、このフレームによってアク
セスする。フレームメモリへの入力は、2系統あり一つ
はVMEバスを介してワークステーションから要素画像
を転送できる。もう一つは、ビデオ信号入力であり、1
/30秒単位に画像データを入力することができる。ま
た、フレームメモリへの出力は、同じく2系統あり、V
MEバスの転送および1/30秒単位のビデオ信号出力
ができる。要素画像のブラウジングでは、フレームメモ
リへの入力はワークステーションからVMEバスを介し
て要素画像を格納する。また、出力は、フレームメモリ
からフレーム画像をビデオ出力し、ディスプレイ用ビデ
オ信号と合成して表示する。図25はフレームメモリの
アクセス方式の説明図である。フレームメモリ2520
へのアクセスは、フレーム番号2522によって行う。
要素画像のブラウジングを行うときには、先ず、グルー
プ番号2500によってグループテーブル2501にア
クセスする。グループテーブル2501には、グループ
番号2502、フレーム番号2503、表示順序番号2
504が格納されており、グループ番号2500を指定
することによって、該当するフレーム番号の集合を取り
出し、表示フレーム番号テーブル2510に表示順序に
従って格納する。この表示フレーム番号テーブル251
0から順次フレーム番号2511を読みだし、フレーム
メモリ2520にアクセスする。
The frame memory is configured to store a large number of frame images. Each frame image is assigned a frame number, and is accessed by this frame. There are two inputs to the frame memory, one of which can transfer elemental images from the workstation via the VME bus. The other is a video signal input.
Image data can be input in units of / 30 seconds. The output to the frame memory is also of two systems.
ME bus transfer and video signal output in 1/30 second units are possible. In elemental image browsing, input to the frame memory stores the elemental image from the workstation via the VME bus. As for the output, a frame image is output as a video from the frame memory, and combined with a display video signal and displayed. FIG. 25 is an explanatory diagram of an access method of the frame memory. Frame memory 2520
Is accessed by the frame number 2522.
When browsing an element image, first, the group table 2501 is accessed by the group number 2500. The group table 2501 includes a group number 2502, a frame number 2503, and a display order number 2
504 are stored. By designating a group number 2500, a set of corresponding frame numbers is extracted and stored in the display frame number table 2510 according to the display order. This display frame number table 251
The frame number 2511 is read sequentially from 0, and the frame memory 2520 is accessed.

【0042】要素画像の形式は2種類とし、1画素4バ
イト1面形式と1画素1バイト3面形式とする。フレー
ムメモリで使用できる形式は、1画素4バイト1面形式
であるが、これに限定されるものではない。フレーム画
像の大きさは、縦512画素、横640画素である。ま
た、画素データは、32ビット構成のフルカラーであ
り、下位バイトから青色、緑色、赤色各8ビットが並ん
でいる。最上位バイトはダミーのデータである。
There are two types of element image formats, one pixel 4 bytes / one-plane format and one pixel 1 byte / one-plane format. The format that can be used in the frame memory is a one-byte four-byte one-plane format, but is not limited thereto. The size of the frame image is 512 pixels vertically and 640 pixels horizontally. Further, the pixel data is a full color of a 32-bit configuration, and blue, green and red 8 bits are arranged from the lower byte. The most significant byte is dummy data.

【0043】図26は検索属性ファイルのデータ形式の
説明図である。検索属性ファイルは、原画像ファイルデ
ータ2600、要素画像ファイルデータ2601、グル
ープデータ2602、キーワードデータ2603からな
り、これらは、2バイトの種類を示す番号2610,2
620,2640,2650によって識別される。例え
ば、原画像ファイルデータ2600は、その種類番号2
610が1であり、続いて原画像の番号2611、原画
像の種類2612、原画像データのファイル名の長さ2
613とファイル名2614、画像のサイズ2615,
1616が格納されている。この原画像の番号2611
によって各文書画像を管理している。要素画像ファイル
データ2601は、その種類番号2621が2であり、
続いて原画像番号2621、要素番号2622、要素画
像データが格納されているファイル名称2625、その
原画像における位置座標2626、2627などが格納
されている。キーワードデータ2603は、その種類2
650が4であり、キーワードデータ番号2651で管
理している。ここでは、付与されている要素画像の番号
2652、キーワードの文字列データ2657等が格納
されている。
FIG. 26 is an explanatory diagram of the data format of the search attribute file. The search attribute file is composed of original image file data 2600, element image file data 2601, group data 2602, and keyword data 2603, which are numbers 2610 and 2 indicating the type of 2 bytes.
620, 2640, and 2650. For example, the original image file data 2600 has the type number 2
610 is 1, followed by the original image number 2611, the original image type 2612, and the file name length of the original image data 2
613, file name 2614, image size 2615,
1616 is stored. Number 2611 of this original image
Manages each document image. The element image file data 2601 has a type number 2621 of 2;
Subsequently, an original image number 2621, an element number 2622, a file name 2625 storing element image data, position coordinates 2626 and 2627 in the original image, and the like are stored. The keyword data 2603 has the type 2
650 is 4 and is managed by the keyword data number 2651. Here, the number 2652 of the assigned element image, character string data 2657 of the keyword, and the like are stored.

【0044】図27は内容検索システムの装置構成であ
る。カラー文書画像を入力し、その要素画像を分離、登
録する。そして、蓄積した要素画像に対して、ディスプ
レイ画面を介して対話的に検索を行う。文書画像入力ス
テーション2701では、カラー文書の表面画像をカラ
ースキャナ2702により採取し、要素画像を分離抽出
する。登録ステーション2703では、要素画像の登録
操作を画面2704を介して対話的に行う。検索ステー
ション2705では、フレームメモリ2707に格納し
ている要素画像のブラウジングを検索画面2706で行
い、所望の要素画像を探索し求める。フレーム画像の複
写のため、カラーハードコピー2708を備えており、
検索結果である要素画像のハードコピーをとることがで
きる。
FIG. 27 shows the configuration of the content search system. A color document image is input, and its element images are separated and registered. Then, the stored element images are interactively searched for via the display screen. In the document image input station 2701, a surface image of a color document is collected by the color scanner 2702, and the element images are separated and extracted. The registration station 2703 interactively performs an operation of registering an element image via a screen 2704. In the search station 2705, browsing of the element images stored in the frame memory 2707 is performed on the search screen 2706 to search for and obtain a desired element image. A color hard copy 2708 is provided for copying frame images.
A hard copy of an element image as a search result can be taken.

【0045】図28は要素画像のブラウジングのための
装置構成の説明図である。検索ステーション2800に
は、フレームメモリユニット2801がVMEバスで接
続されている。フレームメモリユニット2801には半
導体イメージメモリ2809を備えており、多数のフレ
ーム画像(640×512画素のフルカラー画像)を格
納し、1/30秒単位でフレーム画像を入出力する。ま
た、フレーム画像の出力ビデオ信号2808は、スーパ
インポウザ2802によってワークステーション280
0のディスプレイ画面2803に合成することができ
る。フレームメモリユニットには、補助記憶装置とし
て、レーザビデオディスク2811、UマチックVTR
2812が接続されている。レーザビデオディスク28
11と半導体イメージメモリ2809によりメモリ階層
を構成している。要素画像を格納しているフレームメモ
リの内容を、画面に複数個表示することができ、順次、
フレーム番号に従って、スクロールすることができる。
なお、スクロールにはトラックボールを用いる。セレク
タ2805,2806によって、レーザビデオディスク
2811、UマチックVTR2812、半導体イメージ
メモリ2809を切り換えることができ、格納する要素
画像の容量によって当該メモリを階層的に使用する。
FIG. 28 is an explanatory diagram of an apparatus configuration for browsing element images. A frame memory unit 2801 is connected to the search station 2800 via a VME bus. The frame memory unit 2801 includes a semiconductor image memory 2809, stores a large number of frame images (640 × 512 pixel full-color images), and inputs and outputs frame images in 1/30 second units. The output video signal 2808 of the frame image is transmitted to the workstation 280 by the super imposer 2802.
0 on the display screen 2803. The frame memory unit includes a laser video disk 2811 and a U-matic VTR as auxiliary storage devices.
2812 are connected. Laser video disc 28
11 and a semiconductor image memory 2809 constitute a memory hierarchy. A plurality of contents of the frame memory storing the element images can be displayed on the screen.
You can scroll according to the frame number.
Note that a trackball is used for scrolling. The selectors 2805 and 2806 can switch between the laser video disk 2811, the U-matic VTR 2812, and the semiconductor image memory 2809, and the memory is used hierarchically depending on the capacity of the element image to be stored.

【0046】[0046]

【発明の効果】文書要素画像の検索において、フルカラ
ーの写真、図表など、文書画像から分離した要素画像に
対して画面を介して拾い読みを行うことができるので、
要素画像を画面に次々に表示し、ユーザが所望の要素を
目視で見つけることができるという効果がある。また、
ディスプレイへの要素画像の表示速度を切り換えるた
め、高速表示モード、低速表示モードを備えており、ま
た、探索の方向を順次方向と逆方向に切り換えることが
できるため、蓄積した多数の要素画像の中から、目的の
要素画像に効率的に到達することができるという効果が
ある。さらに、このシステムは、文書情報を整理し概念
化することができるため、文書情報の取扱いが容易とな
り戦略的な文書活用はできるという効果がある。また、
ディスプレイ画面を介して対話的に登録操作を行なうこ
とができるため、要素画像を文書画像から切り出して登
録する操作、要素の関連性の付与操作等が信頼性よく実
行できるという効果がある。
According to the present invention, in searching for a document element image, an element image separated from the document image such as a full-color photograph or a chart can be browsed through the screen.
There is an effect that the element images are displayed one after another on the screen, and the user can visually find a desired element. Also,
A high-speed display mode and a low-speed display mode are provided to switch the display speed of the element images on the display, and the search direction can be switched sequentially and in the opposite direction. Therefore, there is an effect that the target element image can be efficiently reached. Further, since this system can organize and conceptualize the document information, there is an effect that the handling of the document information is facilitated and the strategic use of the document can be performed. Also,
Since the registration operation can be performed interactively via the display screen, there is an effect that an operation of cutting out and registering an element image from a document image, an operation of giving an element association, and the like can be executed with high reliability.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施例である文書要素画像の検索シ
ステムの構成の説明図である。
FIG. 1 is an explanatory diagram of a configuration of a document element image search system according to an embodiment of the present invention.

【図2】文書要素の登録システムの説明図であるFIG. 2 is an explanatory diagram of a document element registration system.

【図3】文書画像の要素と関連性の説明図である。FIG. 3 is an explanatory diagram of the relationship between elements and relevance of a document image.

【図4】文書画像内の矩形設定インタフェースの説明図
である。
FIG. 4 is an explanatory diagram of a rectangle setting interface in a document image.

【図5】文書要素の選択インタフェースの説明図であ
る。
FIG. 5 is an explanatory diagram of a document element selection interface.

【図6】要素画像の縮小ならびに拡大表示の説明図であ
る。
FIG. 6 is an explanatory diagram of reduction and enlargement display of an element image.

【図7】要素画像の登録画面の説明図である。FIG. 7 is an explanatory diagram of an element image registration screen.

【図8】文字行並びに文字の表示画面の説明図である。FIG. 8 is an explanatory diagram of a character line and character display screen.

【図9】要素画像の登録のための操作の説明図である。FIG. 9 is an explanatory diagram of an operation for registering an element image.

【図10】レイアウトの登録インタフェースの説明図で
ある。
FIG. 10 is an explanatory diagram of a layout registration interface.

【図11】レイアウトの表示画面の説明図である。FIG. 11 is an explanatory diagram of a layout display screen.

【図12】関連性の登録インタフェースの説明図であ
る。
FIG. 12 is an explanatory diagram of an association registration interface.

【図13】要素の一覧表示画面の説明図である。FIG. 13 is an explanatory diagram of an element list display screen.

【図14】マルチメディアファイルの構成を示す図であ
る。
FIG. 14 is a diagram showing a configuration of a multimedia file.

【図15】要素のデータ形式を示す図である。FIG. 15 is a diagram showing a data format of an element.

【図16】要素画像検索の説明図である。FIG. 16 is an explanatory diagram of an element image search.

【図17】文書要素画像の高速ブラウジングの説明図で
ある。
FIG. 17 is an explanatory diagram of high-speed browsing of a document element image.

【図18】文書要素画像の内容検索の手順を示す図であ
る。
FIG. 18 is a diagram illustrating a procedure of content search of a document element image.

【図19】内容検索のための画面の説明図である。FIG. 19 is an explanatory diagram of a screen for content search.

【図20】フレーム画像の生成手順を示す図である。FIG. 20 is a diagram showing a procedure for generating a frame image.

【図21】文書要素画像の処理過程を示す図である。FIG. 21 is a diagram illustrating a process of processing a document element image.

【図22】文書要素画像の登録操作の手順を示す図であ
る。
FIG. 22 is a diagram illustrating a procedure of a registration operation of a document element image.

【図23】文書要素画像のブラウジング方式の説明図で
ある。
FIG. 23 is an explanatory diagram of a browsing method of a document element image.

【図24】文書要素画像の表示モードの切り換え手順の
説明図である。
FIG. 24 is an explanatory diagram of a procedure for switching a display mode of a document element image.

【図25】フレームメモリのアクセス方式の説明図であ
る。
FIG. 25 is an explanatory diagram of an access method of a frame memory.

【図26】拾い読みのための検索属性ファイルのデータ
形式の説明図である。
FIG. 26 is an explanatory diagram of a data format of a search attribute file for browsing.

【図27】内容検索システムの装置構成を示す図であ
る。
FIG. 27 is a diagram showing an apparatus configuration of a content search system.

【図28】要素画像のブラウジングのための装置構成を
示す図である。
FIG. 28 is a diagram illustrating a device configuration for browsing element images.

【符号の説明】[Explanation of symbols]

103 マルチメディアファイル、 107 拾い読み検索、 320 参照関係、 510 文書要素、 603 要素画像、 700 登録用のディスプレイ画面、 802 文字行、 812 文字、 1000 レイアウトの登録画面、 1401 文書画像データ、 1502 レイアウトデータ、 1702 フレームメモリ、 1806 拾い読み検索の実行ステップ、 2108 フレーム画像、 2310 順方向表示、 2311 逆方向表示、 2312 停止表示、 2501 グループテーブル、 2510 表示フレーム番号テーブル、 2601 要素画像ファイルデータ。 103 multimedia file, 107 browse search, 320 reference relation, 510 document element, 603 element image, 700 registration display screen, 802 character lines, 812 characters, 1000 layout registration screen, 1401 document image data, 1502 layout data, 1702 frame memory, 1806 browse search execution step, 2108 frame image, 2310 forward display, 2311 reverse display, 2312 stop display, 2501 group table, 2510 display frame number table, 2601 element image file data.

───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平3−273363(JP,A) 特開 平3−225565(JP,A) 特開 平2−297182(JP,A) 特開 平4−62670(JP,A) 特開 昭60−123961(JP,A) 情報処理VOL.28,NO.6(1987 −6−15)P.756−764 情報処理VOL.28,NO.6(1987 −6−15)P.710−720 情報処理VOL.28,NO.6(1987 −6−15)P.705−709 ──────────────────────────────────────────────────続 き Continuation of the front page (56) References JP-A-3-273363 (JP, A) JP-A-3-225565 (JP, A) JP-A-2-297182 (JP, A) JP-A-4- 62670 (JP, A) JP-A-60-123961 (JP, A) Information processing VOL. 28, NO. 6 (1987-6-15) P. 756-764 Information processing VOL. 28, NO. 6 (1987-6-15) P. 710-720 Information processing VOL. 28, NO. 6 (1987-6-15) P. 705-709

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】文書画像を入力する手段と、 文書画像の文書要素および検索属性を登録するために、
文書要素の表示位置を表示画面を介して対話的に設定す
る手段と、 文書画像を分離した文書要素画像と、文書画像のレイア
ウトデ−タ並びに文書要素間の関連情報を蓄積する手段
と、 文書要素画像にキーワードを付与し上記キーワードを基
に文字列検索を行い、該当する文書要素画像をグループ
に分け、グループに属する文書要素画像を表示画面に順
次表示する手段を有する文書要素の検索装置であって、 表示画面上に矩形枠を設定し、当該矩形枠の頂点座標を
保持することによって文書要素画像を矩形領域として分
離し、当該文書要素画像がテキスト領域かイメージ領域
かの識別情報を予め保持しておいて表示画面に表示し、
当該分離した各文書要素画像に対して識別情報を選択し
て入力し、入力した識別情報を文書要素画像ごとに保持
する手段と、 分離した文書要素画像に対して複数の文書要素画像を指
定し、指定した文書要素画像同士の関係を登録するとと
もに、指定された要素画像の関係を示す関連情報を線分
等の幾何図形として表示画面上の文書要素画像に対して
表示する手段と、 分離した文書要素画像に対していれ子形式の矩形枠を設
定して保持し、各矩形枠に対して検索属性の名称として
タイトル、著者名、及び要約の少なくともいずれかを含
む文字列をキー入力し、入力された文字列を矩形枠ごと
に保持する手段と、 を有することを特徴とする文書要
素の検索装置。
And means for inputting a document image and registering a document element and a search attribute of the document image.
Interactively set the display position of the document element via the display screen
Means, a document element image obtained by separating the document image, and a layer of the document image.
Means for storing data and related information between document elements
And assign a keyword to the document element image and
Performs a character string search on the
Document element images belonging to a group in order on the display screen.
A document element search device having means for displaying next , wherein a rectangular frame is set on a display screen and vertex coordinates of the rectangular frame are set.
By holding, document element images are divided as rectangular areas.
Release the document element image in the text area or image area
The identification information is stored in advance and displayed on the display screen,
Select identification information for each separated document element image
And store the input identification information for each document element image
Means for specifying a plurality of document element images for the separated document element images.
And register the relationship between the specified document element images.
In addition, related information indicating the relationship between the specified element images
For document element images on the display screen as geometric figures such as
Display means and a rectangular frame in the child format for separated document element images.
As a search attribute name for each rectangular frame.
Title, author name, and / or abstract.
Key in a character string, and enter the character string
Means for holding in a document;
Elementary search device.
JP4308481A 1992-11-18 1992-11-18 Document element retrieval device Expired - Fee Related JP2601111B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4308481A JP2601111B2 (en) 1992-11-18 1992-11-18 Document element retrieval device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4308481A JP2601111B2 (en) 1992-11-18 1992-11-18 Document element retrieval device

Publications (2)

Publication Number Publication Date
JPH06162104A JPH06162104A (en) 1994-06-10
JP2601111B2 true JP2601111B2 (en) 1997-04-16

Family

ID=17981540

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4308481A Expired - Fee Related JP2601111B2 (en) 1992-11-18 1992-11-18 Document element retrieval device

Country Status (1)

Country Link
JP (1) JP2601111B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9514127B2 (en) 2012-09-13 2016-12-06 International Business Machines Corporation Computer implemented method, program, and system for identifying non-text element suitable for communication in multi-language environment

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3266170B2 (en) * 1995-07-04 2002-03-18 日本電信電話株式会社 Data display printer
JP3724859B2 (en) * 1995-10-16 2005-12-07 富士通株式会社 Image display system
JP3381567B2 (en) * 1997-09-05 2003-03-04 凸版印刷株式会社 Editing device
JP4698012B2 (en) * 2000-10-24 2011-06-08 トッパン・フォームズ株式会社 Document providing system and providing method
JP2006350867A (en) 2005-06-17 2006-12-28 Ricoh Co Ltd Document processing device, method, program, and information storage medium
JP5205821B2 (en) * 2007-06-06 2013-06-05 コニカミノルタビジネステクノロジーズ株式会社 Document processing method, document processing program, and document processing apparatus
JP4950802B2 (en) * 2007-08-08 2012-06-13 キヤノン株式会社 Image forming apparatus, image forming method, and computer program
JP5063422B2 (en) 2008-03-14 2012-10-31 キヤノン株式会社 Image processing apparatus, image processing method, and computer program
JP2009301335A (en) * 2008-06-13 2009-12-24 Ricoh Co Ltd Image processing device, image processing method and computer program

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03273363A (en) * 1990-03-22 1991-12-04 Nec Corp Content list display system for moving image

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
情報処理VOL.28,NO.6(1987−6−15)P.705−709
情報処理VOL.28,NO.6(1987−6−15)P.710−720
情報処理VOL.28,NO.6(1987−6−15)P.756−764

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9514127B2 (en) 2012-09-13 2016-12-06 International Business Machines Corporation Computer implemented method, program, and system for identifying non-text element suitable for communication in multi-language environment

Also Published As

Publication number Publication date
JPH06162104A (en) 1994-06-10

Similar Documents

Publication Publication Date Title
US5021989A (en) Document browsing apparatus with concurrent processing and retrievel
KR100345945B1 (en) Method and apparatus for synchronizing, displaying and manipulating text and image documents
US5809318A (en) Method and apparatus for synchronizing, displaying and manipulating text and image documents
US6018749A (en) System, method, and computer program product for generating documents using pagination information
US7610274B2 (en) Method, apparatus, and program for retrieving data
JP2601111B2 (en) Document element retrieval device
JP2001337994A (en) Thumbnail display system and method and recording medium with processing program therefor recorded therein
JPH10275222A (en) Document information management system
JPS6126150A (en) Registering and retrieving device of document picture file
US5588149A (en) Document classification and retrieval with title-based on-the-fly class merge
JPH0622039B2 (en) Library information retrieval device
JPH03276260A (en) Electronic filing device containing title processing function for character code
JP2005071014A (en) Document image processor, document image processing method, program and storage medium
EP0361454B1 (en) Data storage device
US5265076A (en) Image retrieval apparatus using combination retrieval items
AU712181B2 (en) Method and apparatus for synchronizing, displaying and manipulating text and image documents
JPS6210772A (en) Image information processor
JPS63280374A (en) Retrieval/display method for information
JPS6371743A (en) Data filing system
JPH10312387A (en) Processor and method for information processing and recording medium where information processing program is recorded
JPH07271814A (en) Electronic filing device for retrieving data from visual position or shape without requiring keyword
JPH1153373A (en) Device and method for data retrieval and storage medium storing data retrieval program
JP3313482B2 (en) Keyword creation device
JPH08202859A (en) Electronic filing device and its method
JPH10134081A (en) Method and device for supporting page generation

Legal Events

Date Code Title Description
S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080129

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees