JPH0241566A - Electronic picture filing device - Google Patents

Electronic picture filing device

Info

Publication number
JPH0241566A
JPH0241566A JP63190677A JP19067788A JPH0241566A JP H0241566 A JPH0241566 A JP H0241566A JP 63190677 A JP63190677 A JP 63190677A JP 19067788 A JP19067788 A JP 19067788A JP H0241566 A JPH0241566 A JP H0241566A
Authority
JP
Japan
Prior art keywords
document
keywords
image
tables
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63190677A
Other languages
Japanese (ja)
Inventor
Junichi Osumi
大住 淳一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP63190677A priority Critical patent/JPH0241566A/en
Publication of JPH0241566A publication Critical patent/JPH0241566A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To facilitate retrieval by extracting areas of tables, graphics, photographs, or the like which easily remain in the human memory on a document and detecting and classifying features of their sizes, their positions, the number of areas, etc., and automatically registering them as retrieval keywords. CONSTITUTION:A document picture is converted to an electric signal by an image scanner 1, and this picture signal is written in an image memory 2. When a new document is registered in a filling device, areas having certain collective sizes of tables, graphics, photographs, or the like which easily remain in the human memory on the document are extracted, and features of their sizes, their positions, the number of areas, etc., are detected and classified and are automatically registered as retrieval keywords together with keywords which a user designates. Thus, a keyword of automatic generation can be designated based on fuzzy memorization related to tables, graphics. Photographs, or the like though keywords designated by the user are not accurately memorized at the time of retrieval of the document, and the flexibility of retrieval is increased to facilitate retrieval.

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は電子画像ファイルの検索キーの自動付与に関す
る。
DETAILED DESCRIPTION OF THE INVENTION (Field of Industrial Application) The present invention relates to automatic assignment of search keys to electronic image files.

(従来技術) 従来画像電子ファイルにおいて大量の文、書を登録した
場合、ユーザーは文書の大体の内容やレイアウトを記憶
していても文書名やキーワードを正確には覚えておらず
、検索時にそれらの文書名やキーワードを入力できない
ため必要な文書を検索できないという問題があった。 
この問題に対処するための従来技術として、特開昭62
−7415θ号公報では入力時に縮小画像を同時に入力
しておき、検索時に縮小画像の中から画像を見て選ばせ
るようにしている。
(Prior art) When a large number of sentences and calligraphy are registered in a conventional image electronic file, the user may remember the general content and layout of the document, but may not remember the document name or keywords accurately, and may not remember the document name or keywords accurately when searching. There was a problem in that it was not possible to search for the required document because the document name or keyword could not be entered.
As a conventional technique to deal with this problem, Japanese Patent Laid-Open No. 62
In Publication No. 7415θ, reduced images are input at the same time, and the user is asked to select an image from among the reduced images during a search.

また、特開昭E32−89387号公報では原画から属
性画像を作成し、ユーザーに選ばせるか、属性画像を入
力させ類似度を計算し検索するようにしている。
Further, in Japanese Patent Application Laid-Open No. 32-89387, an attribute image is created from the original image and the user is allowed to select or input the attribute image to calculate the degree of similarity and search.

(発明が解決しようとする課題) しかし、上記縮小画像方式(特開昭82−74156号
公報)では縮小画像を記憶するので、そのための記憶容
景を多く必要とし、また、縮小画像を表示するのに時間
がかかるという問題が残っている。
(Problem to be Solved by the Invention) However, since the above-mentioned reduced image method (Japanese Unexamined Patent Application Publication No. 82-74156) stores reduced images, it requires a large amount of storage capacity, and it is also difficult to display reduced images. The problem remains that it takes time.

また、属性画像方式(特開昭82−69367号公報)
では、属性画像の入力・類似度計算に時間が掛かると言
つう問題が残っている。
Also, the attribute image method (Japanese Patent Application Laid-open No. 82-69367)
However, there remains the problem that it takes time to input attribute images and calculate similarity.

本発明は、これらの問題を解決し、ユーザーが文書名、
キーワードを正しく記憶していない時でも、容易に文書
を検索することのできるキーワードをファイル入力時に
自動的に作成付与することのできる電子画像ファイル装
置を実現することを目的とするものである。
The present invention solves these problems and allows users to
To provide an electronic image file device capable of automatically creating and assigning keywords at the time of inputting a file so that a document can be easily searched even when the keywords are not stored correctly.

(課題を解決するための手段) 本発明は、文書を走査入力し、外部記憶装置へ登録し、
所定のキーワードにより検索する文書のファイル装置に
おいて、文書中の表、図形、写真等の一定のまとまりの
ある大きさを持った領域およびその種類を識別する手段
と、前記識別した領域の個数、位置、サイズ等の人間の
記憶に残り易い属性を検出する手段と、文書登録時に、
前記識別した領域の種類、属性をその文書の検索用キー
ワードとして登録する手段とを育するものである。
(Means for Solving the Problem) The present invention scans and inputs a document, registers it in an external storage device,
In a file device for documents searched by a predetermined keyword, a means for identifying areas having a certain uniform size such as tables, figures, photographs, etc. in a document and their types, and the number and position of the identified areas. , means for detecting attributes that are easily remembered by humans, such as size, and when registering documents,
A means for registering the type and attribute of the identified area as a search keyword for the document is developed.

(作 用) 本発明は、文書の画像ファイル装置に新しい文書を走査
入力する際に、文書中の表、図形、写真等の一定のまと
まりのある大きさを持った領域を、その領域の種類(即
ち、表、図形、写真等の種類)と共に識別する。次に、
識別した領域の個数、位置、サイズ等の人間の記憶に残
り易い属性を検出する。そして、検出した属性をその入
力文書の検索用キーワードとして自動的に付与する。
(Function) When a new document is scanned and input into a document image file device, the present invention scans an area of a certain group size such as a table, figure, or photograph in the document based on the type of the area. (i.e. types of tables, figures, photographs, etc.). next,
Attributes that are easily remembered by humans, such as the number, position, and size of identified areas, are detected. Then, the detected attribute is automatically assigned as a search keyword for the input document.

本発明は、新しい文書をファイル装置に登録するときに
、ユーザーの指定するキーワードの登録に併せて、その
文書における人間の記憶にパターンとして残り易い表、
図形、写真等の一定のまとまりのある大きさを持った領
域を抽出し、それらの大きさ、位置、個数等の特徴を検
出し分類して、検索用キーワードとして自動的に登録す
るので、その文書の検索時においては、ユーザー指定の
キーワードを正確に憶えていないときにも、表、図形、
写真等に関する曖昧な記憶に基づいて前記自動作成のキ
ーワードを指定することが可能であり、検索の柔軟性が
増し、検索を容易にする。
When registering a new document in a file device, the present invention provides a table, which is likely to remain as a pattern in human memory in the document, in addition to registering keywords specified by the user.
It extracts areas with a certain size, such as figures and photos, detects and categorizes their characteristics such as size, position, and number, and automatically registers them as search keywords. When searching for documents, even if you don't remember the exact keywords specified by the user, you can search for tables, figures, etc.
It is possible to specify the automatically generated keywords based on vague memories about photographs, etc., increasing search flexibility and making the search easier.

(実施例) 第1図は、電子画像ファイル装置においで、文書中の一
定のまとまりのある大きさを持った領域として表、図形
、枠で囲まれた領域等を抽出してキーワードを作成する
本発明の第1の実施例の概略の構成を示−すものである
(Example) Figure 1 shows how, in an electronic image file device, keywords are created by extracting tables, figures, areas surrounded by frames, etc. as areas with a certain uniform size in a document. 1 shows a schematic configuration of a first embodiment of the present invention.

文書画像はイメージスキャナ1により、電気信号に変換
され2値のディジタルデータとして出力される。この画
像信号はイメージメモリ2に書き込まれる。線分メモリ
3にはイメージメモリ2よりCPU4によって抽出され
た文書中の線図形が格納される。また、CPU4はファ
イル装置全体の動作も制御する。モニターデイスプレィ
6は入力あるいは検索画像をモニタするものである。キ
ーボード7は検索キーワード等を入力するものである。
The document image is converted into an electrical signal by the image scanner 1 and output as binary digital data. This image signal is written into the image memory 2. Line segment memory 3 stores line figures in a document extracted from image memory 2 by CPU 4. The CPU 4 also controls the operation of the entire file device. A monitor display 6 is used to monitor input or search images. The keyboard 7 is used to input search keywords and the like.

光ディスク8は入力された文書、キーワード等を記憶す
る大容量の外部記憶装置である。プリンタ9は検索結果
等をプリント出力するものである。
The optical disc 8 is a large-capacity external storage device that stores input documents, keywords, and the like. The printer 9 prints out search results and the like.

上記構成において、まず新しい文書を登録する時の動作
について説明する。文書は走査2値化されイメージメモ
リ2に書き込まれる。ここで、イメージメモリ2上の文
書画像から線分画像のみを抽出し、線分メモリ3に転記
する。画像中から線分のみを抽出する方法については、
連結黒画素の外接矩形枠の大きさによる方法、輪郭追跡
により長さを測定する方法、線密度の差を用いる方法、
Hough変換を用いる方法、等多くの方法が提案され
ており、これらの方法のいずれを用いてもよいが、ここ
ではランレングスを用いた簡便な方法によって説明する
In the above configuration, the operation when registering a new document will be explained first. The document is scanned and binarized and written to the image memory 2. Here, only line segment images are extracted from the document image on the image memory 2 and transferred to the line segment memory 3. For information on how to extract only line segments from an image,
A method based on the size of a circumscribed rectangular frame of connected black pixels, a method that measures the length by contour tracing, a method that uses the difference in line density,
Many methods have been proposed, such as a method using Hough transformation, and any of these methods may be used, but a simple method using run length will be explained here.

まず、CPU4によってイメージメモリ2を水平O垂直
に走査することにより、所定長以上のランレングスをも
つ黒画素連を抽出し、線分メモリ3にコピーする。原画
像10と線分メモリ3上での画像の対応を第2図に示す
。この方法では水平垂直方向の線分を検出しているので
図のような結果が得られる。
First, by scanning the image memory 2 horizontally and vertically by the CPU 4, a series of black pixels having a run length of a predetermined length or more is extracted and copied to the line segment memory 3. The correspondence between the original image 10 and the images on the line segment memory 3 is shown in FIG. This method detects line segments in the horizontal and vertical directions, so the results shown in the figure are obtained.

次にここで得られた各黒画素の連結図形について各図形
が文書の外枠であるか、表の枠であるか、それ以外の図
形の一部であるかを判定する。第3図に連結図形の判定
の手順の1例を示す。この例では表は最低2行2列あり
、外枠ももつことを想定している。
Next, it is determined whether each connected figure of each black pixel obtained here is an outer frame of a document, a frame of a table, or a part of another figure. FIG. 3 shows an example of a procedure for determining connected figures. This example assumes that the table has at least two rows and two columns, and also has an outer frame.

連結図形の判定においては、第3図に示すように、まず
連結図形が矩形を持っているか否かを調べ、もし、持っ
ていなければその連結図形は表以外の図形と判定する。
In determining a connected figure, as shown in FIG. 3, it is first checked whether the connected figure has a rectangle, and if it does not have a rectangle, the connected figure is determined to be a figure other than a table.

連結図形が矩形を持っているときには、最も小さい矩形
の大きさを調べ、もしそれが表を構成する最小の枠の大
きさW・H(Wは矩形の幅、Hは矩形の高さ)より小さ
いときは、その矩形を含む連結図形は表ではないので、
連結図形は表以外の図形と判定する。もし最も小さい矩
形の大きさが表を構成する最小の枠の大きさW・H(W
は矩形の幅、Hは矩形の高さ)より大きいときは、矩形
の数が1個であるか否かを調べる。矩形の数が1個の場
合には、その矩形の面積を原稿の面積で除した値がある
一定値A(0゜9程度に設定すればよい)より大きいか
どうかを調べ、大きければその連結図形は外枠であると
判定する。小さければ、連結図形とその内部は表以外の
図形と判定する。矩形の数が2以上の場合には、表であ
る可能性は高いが、それを確認するために連結図形中の
起点、終点のX座標がほぼ等しい水平線が3本以上ある
か否か、および連結図形中の起点、終点のy座標がほぼ
等しい垂直線がそれぞれ3本以上あるか否かを調べ、い
ずれもYESであるとき連結図形は表の枠と判定し、そ
れ以外は表以外の図形と判定する。
When the connected figure has a rectangle, check the size of the smallest rectangle, and if it is larger than the size of the smallest frame that makes up the table W H (W is the width of the rectangle, H is the height of the rectangle) When it is small, the connected shape containing the rectangle is not a table, so
A connected figure is determined to be a figure other than a table. If the size of the smallest rectangle is the size of the smallest frame composing the table W H (W
is the width of the rectangle and H is the height of the rectangle), it is checked whether the number of rectangles is one. If the number of rectangles is one, check whether the area of the rectangle divided by the area of the document is larger than a certain value A (it should be set to about 0°9), and if it is, then connect them. The figure is determined to be an outer frame. If it is smaller, the connected figure and its interior are determined to be figures other than tables. If the number of rectangles is 2 or more, there is a high possibility that it is a table, but to confirm this, check whether there are 3 or more horizontal lines whose starting and ending points have approximately the same X coordinates in the connected figure, and Check whether there are three or more vertical lines in the connected figure whose y coordinates of the starting point and end point are almost the same, and if both are YES, the connected figure is determined to be a table frame, otherwise it is a figure other than a table. It is determined that

判定の基準・手順を変更すれば外枠のない表も抽出可能
になる。この結果線分メモリ3上の各連結図形は第4図
に示すようにラベル付けされる。
By changing the criteria and procedures for judgment, it becomes possible to extract tables without an outer frame. As a result, each connected figure on the line segment memory 3 is labeled as shown in FIG.

次に表の特徴を規定する方法の1例を示す。独立した表
の個数を表の数、また第5図に示すように、表の外枠に
囲まれた面積を表の大きさ、表の中心座標を表の位置と
する。以上により得られた文書外枠の有無、表の数、表
の大きさ、表の位置、表以外の図形の有無、等の事項を
登録時、ユーザーの指定項目やキーワードと同様に検索
のキーとして登録する。
Next, an example of a method for specifying the characteristics of a table will be shown. The number of independent tables is the number of tables, the area surrounded by the outer frame of the table is the size of the table, and the center coordinates of the table are the position of the table, as shown in FIG. When registering the information obtained above, such as the presence or absence of a document frame, the number of tables, the size of tables, the position of tables, the presence or absence of figures other than tables, search keys can be used in the same way as user-specified items and keywords. Register as.

検索の時は1例として第6図の検索様式の設定例に示す
ようにユーザーが設定した登録項目とシステム側が自動
的に付与した項目により検索できる。各項目は論理積(
AND)の条件になる。また、各項目内に論理和(OR
)の条件を設けることも可能である。キーワード等は直
接ユーザーがキーボ工ドから入力しなくても、−覧のメ
ニューを表示して選択させることも可能である。
When searching, for example, as shown in the example of search format settings in FIG. 6, the search can be performed using registered items set by the user and items automatically assigned by the system. Each item is a logical product (
AND) condition. Also, within each item, OR
) is also possible. Keywords and the like can also be selected by displaying a menu without the user having to input them directly from the keyboard.

表の位置は第7図に示すような9通り程度の分類で十分
と考えられるので、メニューからいずれか選ぶようにす
ればよい。また、大きさも大体で良いと考えられるので
、第8図に示すような大中小の3段階でもよい。この場
合、小は文書の1/4以下、中は1/4〜1/2の間、
大は1/2以上となる。
It is considered that nine classifications as shown in FIG. 7 are sufficient for the position of the table, so any one can be selected from the menu. Further, since it is considered that the size is approximately the same, three levels of large, medium and small as shown in FIG. 8 may be used. In this case, small is less than 1/4 of the document, medium is between 1/4 and 1/2,
Large is 1/2 or more.

本実施例では、設定されたキーにより、検索する場合に
ついて説明したが、実際の使用では人の感覚は曖昧なと
ころがあるので、表の位置、太きさ、個数をユーザーの
設定値の前後に広げて検索できる検索モードを設定して
もよい。また、本実施例では表の行数列数までは解析し
なかったが、平行線の数・関係等を調べることにより求
めることができるので、これを用いて検索のキーとして
、表の行数列数を使うことも可能である。また、ランレ
ングス検出、ラベル付けも説明ではCPU4で行なった
が更に、高速性が必要であれば専用回路によって構成す
ることも可能である。
In this example, we have explained the case of searching using the set keys, but in actual use, human senses may be ambiguous, so the position, thickness, and number of tables may be changed before or after the user's set values. You may also set a search mode that allows you to expand your search. In addition, although the number of rows and columns of the table was not analyzed in this example, it can be determined by examining the number and relationship of parallel lines, so using this as a search key, the number of rows and columns of the table It is also possible to use In addition, run length detection and labeling are also performed by the CPU 4 in the explanation, but if higher speed is required, they can also be configured by a dedicated circuit.

以上に詳述したように、第1実施例では、線分抽出、構
造解析により得られる、文書の外枠の有無、表の個数、
大きさ、位置、表以外の図形の有無等を画像登録時にユ
ーザーのキーワードと同様に登録し、検索時に検索のキ
ーの一つとして検索できるようにしたので、ユーザーが
文書名のキーワードを正しく記憶していなくても、文書
の外枠や表、図形等の文書画像の記憶に残り易いパター
ンとしての特徴を指示する上記キーワードにより簡単に
検索でき、検索の柔軟性を増すことができる。
As detailed above, in the first embodiment, the presence or absence of an outer frame of a document, the number of tables, and
Size, position, presence or absence of figures other than tables, etc. are registered in the same way as user keywords when registering images, and can be searched as one of the search keys when searching, making it easier for users to remember document name keywords correctly. Even if the document image is not searched, it can be easily searched using the above-mentioned keywords indicating features of a document image, such as a document's outer frame, table, figure, etc., as a pattern that is easy to remember, and search flexibility can be increased.

なお、この第1実施例では、画像を属性により分類可能
なので、表のみのデータファイルや図面のみの図面ファ
イルを自動的に編集・作成することができる。また、文
書の外枠等本質的には不要なデータを削除しデータ量を
削減することが可能である。
In this first embodiment, since images can be classified by attributes, it is possible to automatically edit and create data files containing only tables and drawing files containing only drawings. Furthermore, it is possible to reduce the amount of data by deleting essentially unnecessary data such as the outer frame of the document.

第9図は、電子画像ファイル装置において、文書中の一
定のまとまりのある大きさを持った領域として写真画像
のような中間調領域を抽出してキーワードを作成する本
発明の第2の実施例の概略の構成を示すものである。
FIG. 9 shows a second embodiment of the present invention in which a keyword is created by extracting a halftone area such as a photographic image as an area with a certain uniform size in a document in an electronic image file device. This figure shows the general configuration of .

文°書画像はイメージスキャナ1により、電気信号に変
換され多値のディジタルスキャナとして出力される。こ
の画像信号は文字領域・中間調領域識別回路(以下、T
/■識別回路という)20により画像の特性に応じて文
字領域と写真等の中間調領域に識別され、文字領域は2
値化処理、中間調領域はデイザ等の疑似中間調処理され
、イメージメモリ21に書き込まれる。中間調領域マツ
プ22の原画像のmXn画像(m=nも可能)が1画素
に相当するようにマツピングされていて、該当画素群の
過半数がT/I識別回路20で中間調領域と識別された
ときセットされる。モニターデイスプレィ6は入力ある
いは検索画像をモニタするためのもの、である。キーボ
ード7はファイル文書を格納する検索キーワード等を入
力するために設けられている。光ディスク8は大容量の
外部記憶装置は記憶装置である。プリンタ9は検索結果
等をプリント出力するためのものである。CPU4はこ
れらの動作を制御するものである。
The document image is converted into an electrical signal by the image scanner 1 and output as a multivalued digital scanner. This image signal is processed by a character area/halftone area identification circuit (hereinafter referred to as T
/■Discrimination circuit) 20 distinguishes between a character area and a halftone area such as a photograph according to the characteristics of the image.
The halftone area is subjected to pseudo halftone processing such as dithering, and then written to the image memory 21. The mXn image (m=n is also possible) of the original image of the halftone area map 22 is mapped to correspond to one pixel, and the majority of the corresponding pixel group is identified by the T/I identification circuit 20 as the halftone area. It is set when The monitor display 6 is for monitoring input or search images. A keyboard 7 is provided for inputting search keywords and the like for storing file documents. The optical disk 8 is a large capacity external storage device. The printer 9 is used to print out search results and the like. The CPU 4 controls these operations.

以上のように構成された本第2実施例の動作について説
明する。まず新しい文書を登録するときの動作について
説明する。文書を走査入力すると、画像の特性により画
素ごとに2値化あるいはデイザ処理された画像がイメー
ジメモリ21に書き込まれる。同時に中間調領域マツプ
22へは原画23の中間調画像と識別された領域に相当
するマツプ上の画素に対して書き込みが行われる。中間
調領域の判定はその領域(原画のmXn画素)内の中間
調画素の数が過半数を越えた場合とする。中間調画素の
数が過半数を越えた場合とする。T/工識別方式は特開
昭58−205376号公報等で示されるように画像の
濃度勾配の差を利用したものや画像の空間周波数成分の
差を利用したもの等多くの方法が公知となっているので
ここでは説明を省略する。原画像と中間調領域マツプ上
での画像の対応を第10図に示す。原画のmXn画素内
で中間調と識別されたものの数により中間調領域かそう
でないかを判定しているので、原画像の中間調領域の周
辺部に相当する部分はマツプ上ではギザギザになる可能
性がある。しかし、原画に対し数画素程度の識別誤りが
発生しても領域としての判定を誤ることはない。
The operation of the second embodiment configured as above will be explained. First, the operation when registering a new document will be explained. When a document is scanned and input, the image is binarized or dithered pixel by pixel depending on the characteristics of the image and written into the image memory 21. At the same time, writing is performed on the halftone area map 22 for pixels on the map corresponding to areas identified as halftone images of the original image 23. A halftone region is determined when the number of halftone pixels in that region (mXn pixels of the original image) exceeds the majority. It is assumed that the number of halftone pixels exceeds the majority. As shown in Japanese Patent Application Laid-Open No. 58-205376, there are many methods known as T/work identification methods, such as those that utilize differences in the density gradient of images and those that utilize differences in spatial frequency components of images. Therefore, the explanation is omitted here. FIG. 10 shows the correspondence between the original image and the image on the halftone area map. Since it is determined whether it is a halftone area or not based on the number of pixels identified as halftones in the mXn pixels of the original image, the parts corresponding to the periphery of the halftone area of the original image may be jagged on the map. There is sex. However, even if an identification error of several pixels occurs in the original image, it will not be incorrectly determined as a region.

次に中間調領域の特徴を規定する方法の1例を示す。第
10図で得られた中間調領域マツプ上の画像に対して第
11図に示すように連結画素の外接矩形24を取る。こ
の面積を中間調領域の大きさとする。また、外接矩形2
4の中心座標を中間領域の位置とする。更に、中間調領
域がない場合あるいはその大きさがいずれもある大きさ
以下の場合(原画で例えば、1cmX1cm以下の中間
調領域は存在しないと考えられるので)は、中間調領域
の数を0とする。それ以上の大きさの領域の数を中間調
領域の数とする。以上により、得られた事項、即ち中間
調領域の大きさ、位置、個数等を登録時にユーザーの指
定項目やキーワードと同様に検索のキーとして登録する
Next, an example of a method for defining the characteristics of the halftone area will be described. For the image on the halftone area map obtained in FIG. 10, a circumscribing rectangle 24 of connected pixels is taken as shown in FIG. This area is defined as the size of the halftone area. Also, the circumscribed rectangle 2
Let the center coordinates of 4 be the position of the intermediate area. Furthermore, if there is no halftone area or if the size of each halftone area is less than a certain size (for example, it is considered that there is no halftone area smaller than 1cm x 1cm in the original image), set the number of halftone areas to 0. do. The number of areas larger than this is defined as the number of halftone areas. As described above, the obtained items, ie, the size, position, number, etc. of the halftone area, are registered as search keys in the same way as the user's specified items and keywords at the time of registration.

検索のときは一例として第12図に示すようにユーザー
が設定した登録項目とシステム側が自動的に付与した項
目により検索できる。各項目は論理積(AND)の条件
になる。また、各項目内に論理和(OR)の条件を設け
ることも可能である。
When searching, for example, as shown in FIG. 12, the search can be performed using registered items set by the user and items automatically assigned by the system. Each item becomes a logical product (AND) condition. It is also possible to provide a logical sum (OR) condition within each item.

キーワード等は直接ユーザーがキーボードから入力しな
くても、−覧のメニューを表示して選択させるように構
成することも可能である。
It is also possible to display a menu for the user to select keywords, etc., without having to input them directly from the keyboard.

中間調領域の位置は第1実施例と同様に第7図に示すよ
うな9通り程度の分類で十分と考えられるので、メニュ
ーからいずれか選ぶようにすればよい。また、大きさも
大体で良いと考えられるので、第1実施例と同様に第8
図に示すような大中小の3段階程度でもよい。
Similar to the first embodiment, it is considered that nine classifications as shown in FIG. 7 are sufficient for the position of the halftone area, so any one can be selected from the menu. In addition, since it is considered that the size is approximately the same, as in the first embodiment, the eighth
It may be in three stages of large, medium and small as shown in the figure.

この第2実施例では、設定された上記キーワードにより
検索する場合について説明したが、人の感覚は曖昧なと
ころがあるので、実際の使用では中間調領域の位置、大
きさ個数をユーザーの設定値の前後に広げて検索できる
検索モードを設定してもよい。
In this second embodiment, a case has been described in which a search is performed using the set keywords, but since human senses are sometimes ambiguous, in actual use, the position, size, and number of halftone areas are determined by the user's setting values. You may also set a search mode that allows you to expand your search forward and backward.

以上のように、第2実施例では、T/I識別回路20に
よって得られる、中間調領域の個数、大きさ、位置等を
自動的に検出し、分類して、画像登録時にユーザーのキ
ーワードと゛同様に登録し、検索時に検索のキーワード
の一つとして検索するようにしたので、ユーザーが文書
名・キーワードを正しく記憶していなくても、ユーザー
がおぼろげに記憶している写真等の文書画像中の領域の
特徴を示す上記キーワードにより簡単に検索でき、検索
の柔軟性を増すことができる。
As described above, in the second embodiment, the number, size, position, etc. of halftone areas obtained by the T/I identification circuit 20 are automatically detected and classified, and the user's keywords are By registering in the same way and searching as one of the search keywords when searching, even if the user does not remember the document name or keyword correctly, it will be possible to search for documents such as photos or other documents that the user vaguely remembers. It is possible to easily search using the above keywords that indicate the characteristics of the area, increasing the flexibility of the search.

なお、従来は中間調画像の再現性を良くするためのみに
T/I識別回路を用いていたが、第2実施例ではこのT
 /、 I識別回路を共用するので、コストアップを考
えることなく新たな機能を付加できる。また、この第2
実施例では概略の中間調画像エリアを抽出可能なので、
拡大縮小等の画像編集を行うときや画像圧縮を行うとき
に、疑似中間調に適したアルゴリズムを適用でき、高画
質、高圧縮率を得ることが可能になる。
Conventionally, a T/I identification circuit was used only to improve the reproducibility of halftone images, but in the second embodiment, this T/I identification circuit is used only to improve the reproducibility of halftone images.
/, Since the I identification circuit is shared, new functions can be added without considering increased costs. Also, this second
In the example, it is possible to extract the approximate halftone image area, so
When performing image editing such as scaling or image compression, an algorithm suitable for pseudo halftones can be applied, making it possible to obtain high image quality and high compression ratio.

(発明の効果) 本発明は、新しい文書をファイル装置に登録するときに
、ユーザーの指定するキーワードの登録に併せて、その
文書における人間の記憶に残り易い表、図形、写真等の
領域を抽出し、それらの大きさ、位置、個数等の特徴を
検出し分類して、検索用キーワードとして自動的に登録
するので、その文書の検索時においては、ユーザー指定
のキーワードを正確に憶えていないときにも、ユーザー
は表、図形、写真等の領域に関する曖昧な記憶に基づい
て前記自動作成のキーワードを指定することが可能であ
り、検索の柔軟性が増し、検索を容易にする。
(Effects of the Invention) When registering a new document in a file device, the present invention extracts areas of the document such as tables, figures, and photographs that are easily remembered by humans in addition to registering keywords specified by the user. However, since the features such as size, position, number, etc. are detected and classified and automatically registered as search keywords, when searching for the document, if the user does not remember the specified keyword accurately, In addition, the user can specify the automatically generated keywords based on vague memories regarding areas such as tables, figures, photographs, etc., increasing the flexibility of the search and making the search easier.

また、本発明は、上記のようなキーワードを付加しても
記憶容量を従来の縮小画像方式のように著しく増大させ
るようなことはなく、また、従来の属性画像方式のよう
に入力に時間がかかると言うこともない。
In addition, the present invention does not significantly increase the storage capacity unlike the conventional reduced image method even if the keywords are added as described above, and it does not take much time to input unlike the conventional attribute image method. I can't say that it takes.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の第1実施例の構成を示すブロック図で
ある。 第2図は原画と線分メモリ上の画像の対応を示す図であ
る。 第3図は連結図形の判定方法の一例を示す図である。 第4図は各連結図形のラベル付けを示す図である。 第5図は表の特徴の規定の一例を示す図である。 第6図は検索式の設定の一例を示す図である。 第7図は表、図形、写真等の位置を9個に分類する場合
の位置とキーワードの関係を示す図である。 第8図は表、図形、写真等の大きさを分類する場合の大
きさとキーワードの関係を示す図である。 第9図は本発明の2の実施例の構成を示すブロック図で
ある。 第10図は原画と中間調領域マツプ上の画像の対応を示
す図である。 第11図は中間調領域の規定方法を示す図である。 第12図は検索式の設定の一例を示す図である。 1・・・イメージスキャナ、2.21・・・イメージメ
モリ、3・・・線分メモリ、4・・・CPU、5・・・
データバス、6・・・画像モニター 7・・・キーボー
ド、8・・・光ディスク、9・・・プリンタ、20・・
・文字領域・中間調領域識別回路(T/I識別回路)、
22・・・中間調領域マツプ。 特許出願人  富士ゼロックス株式会社代  理  人
   弁理士  岩  上  昇  −第1図 第2図 第4図 第5図 第9図 第10図 手続補正書印釦
FIG. 1 is a block diagram showing the configuration of a first embodiment of the present invention. FIG. 2 is a diagram showing the correspondence between the original image and the image on the line segment memory. FIG. 3 is a diagram showing an example of a method for determining connected figures. FIG. 4 is a diagram showing labeling of each connected figure. FIG. 5 is a diagram showing an example of defining the characteristics of a table. FIG. 6 is a diagram showing an example of setting a search expression. FIG. 7 is a diagram showing the relationship between positions and keywords when the positions of tables, figures, photographs, etc. are classified into nine categories. FIG. 8 is a diagram showing the relationship between sizes and keywords when classifying the sizes of tables, figures, photographs, etc. FIG. 9 is a block diagram showing the configuration of a second embodiment of the present invention. FIG. 10 is a diagram showing the correspondence between the original image and the image on the halftone area map. FIG. 11 is a diagram showing a method for defining a halftone area. FIG. 12 is a diagram showing an example of setting a search expression. 1... Image scanner, 2.21... Image memory, 3... Line segment memory, 4... CPU, 5...
Data bus, 6... Image monitor, 7... Keyboard, 8... Optical disk, 9... Printer, 20...
・Character area/halftone area identification circuit (T/I identification circuit),
22... Halftone area map. Patent Applicant Fuji Xerox Co., Ltd. Agent Patent Attorney Noboru Iwa - Figure 1 Figure 2 Figure 4 Figure 5 Figure 9 Figure 10 Procedural Amendment Form Stamp Button

Claims (1)

【特許請求の範囲】 文書を走査入力し、記憶装置へ登録し、所定のキーワー
ドにより検索する文書のファイル装置において、 文書中の表、図形、写真等の一定のまとまりのある大き
さを持った領域およびその種類を識別する手段と、 前記識別した領域の個数、位置、サイズ等の人間の記憶
に残り易い属性を検出する手段と、文書登録時に、前記
識別した領域の種類、属性をその文書の検索用キーワー
ドとして登録する手段と を有することを特徴とする電子画像ファイル装置。
[Claims] In a document filing device in which a document is scanned and inputted, registered in a storage device, and searched by a predetermined keyword, tables, figures, photographs, etc. in the document have a certain uniform size. means for identifying regions and their types; means for detecting attributes that are easily remembered by humans, such as the number, position, size, etc. of the identified regions; 1. An electronic image file device comprising means for registering as a search keyword.
JP63190677A 1988-08-01 1988-08-01 Electronic picture filing device Pending JPH0241566A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63190677A JPH0241566A (en) 1988-08-01 1988-08-01 Electronic picture filing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63190677A JPH0241566A (en) 1988-08-01 1988-08-01 Electronic picture filing device

Publications (1)

Publication Number Publication Date
JPH0241566A true JPH0241566A (en) 1990-02-09

Family

ID=16262048

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63190677A Pending JPH0241566A (en) 1988-08-01 1988-08-01 Electronic picture filing device

Country Status (1)

Country Link
JP (1) JPH0241566A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0525427A2 (en) * 1991-07-29 1993-02-03 International Business Machines Corporation Non-text object storage and retrieval

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60160475A (en) * 1984-02-01 1985-08-22 Hitachi Ltd Method for retrieving document file

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60160475A (en) * 1984-02-01 1985-08-22 Hitachi Ltd Method for retrieving document file

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0525427A2 (en) * 1991-07-29 1993-02-03 International Business Machines Corporation Non-text object storage and retrieval
EP0525427A3 (en) * 1991-07-29 1994-01-12 Ibm

Similar Documents

Publication Publication Date Title
JP4266695B2 (en) Image processing apparatus and image processing method
JP3504054B2 (en) Document processing apparatus and document processing method
JP2816241B2 (en) Image information retrieval device
US7454060B2 (en) Image processor for character recognition
JP4897520B2 (en) Information distribution system
JP2001060247A (en) Device and method for image processing
JPH05347698A (en) Method for detecting highlight region
US6163623A (en) Method and apparatus for recognizing images of documents and storing different types of information in different files
JP3335009B2 (en) Image processing method and image processing apparatus
CN101551859A (en) Image recognition device and image retrieval device
US20080244384A1 (en) Image retrieval apparatus, method for retrieving image, and control program for image retrieval apparatus
JP4035228B2 (en) Image processing method and image processing apparatus
CN113936764A (en) Method and system for desensitizing sensitive information in medical report sheet photo
JP4321088B2 (en) Document filing device
JPH0241566A (en) Electronic picture filing device
JPH08180068A (en) Electronic filing device
EP0975146B1 (en) Locating the position and orientation of multiple objects with a smart platen
JPH03126181A (en) Area dividing method for document image
JP3171626B2 (en) Character recognition processing area / processing condition specification method
JP4501731B2 (en) Image processing device
JP3338107B2 (en) Image processing device for micro film reader
JPH11175519A (en) Method for analyzing document and device therefor
EP0974931A1 (en) Method and apparatus for identifying a plurality of sub-images in an input image
JPH0743718B2 (en) Multimedia document structuring method
JPH0830725A (en) Device and method for processing image