JPS62165277A - Document picture data filing system - Google Patents

Document picture data filing system

Info

Publication number
JPS62165277A
JPS62165277A JP61006414A JP641486A JPS62165277A JP S62165277 A JPS62165277 A JP S62165277A JP 61006414 A JP61006414 A JP 61006414A JP 641486 A JP641486 A JP 641486A JP S62165277 A JPS62165277 A JP S62165277A
Authority
JP
Japan
Prior art keywords
point
coordinate
length
file
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61006414A
Other languages
Japanese (ja)
Inventor
Haruo Takeda
晴夫 武田
Kuniaki Tabata
邦晃 田畑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP61006414A priority Critical patent/JPS62165277A/en
Publication of JPS62165277A publication Critical patent/JPS62165277A/en
Pending legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PURPOSE:To reduce a filing capacity for a document picture data by finding the minimum rectangle out of rectangles including all of the contents posted on the original of an input document picture data, and storing it in a form that a regulated size of space part is added in the neighborhood of the rectangle at a filing device. CONSTITUTION:The whole area 31 of a picture memory MEM1 are scanned in the (x) direction, and the accumulated value of black picture elements at each line is found, and it is written at a code memory CMEM in a table form as the accumulated value for (y) coordinate, and out of the accumulated values, a value which exceeds a prescribed threshold value epsilon1 is searched in order of the smallest (y) coordinate, and a search is terminated at a point y0 where is the first exceeding point. Next, the value is searched in the reverse order from the largest (y) coordinate, and a point y1 is found, and the part of a length l1 is found, and the part of a length ly, the (y) coordinate of which is between y0 and y1, is recognized as an effective part in (y) direction. Similarly, a point x0 and a point x1 are found, and the part of a length lx between the two points is recognized as the effective part in (x) direction. The bit of information, for example, is stored at the code memory CMEM as a pair of a left-upper coordinate (x0, y0), and a lateral length lx, and a longitudinal length ly. In this way, the filing capacity for the document picture can be reduced, and a retrieving speed for the document picture can be improved.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は画像ファイルシステムに係り、特に文書画像デ
ータに好適な文書画像データのファイル方式に関する。
DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to an image file system, and particularly to a document image data file system suitable for document image data.

〔従来の技術〕[Conventional technology]

一般の書類、図面、新聞、学術論文、特許明細書や銀行
端末における伝票等の文書を、画像データとして光ディ
スク等の媒体Eこ格納する画像ファイルシステムIこお
いては、ファイル効率がよく、簡易に画像データを登録
する方式が強く望まれている。
An image file system that stores documents such as general documents, drawings, newspapers, academic papers, patent specifications, and bank terminal slips as image data on media such as optical disks is highly efficient and simple. There is a strong desire for a method for registering image data in

従来の画像ファイルシステムにおいては、例えば、日立
製作所の光ディスクファイルシステム操作書(日立マニ
ュアル6O−10−001−20)に記載のように、各
操作者が、入力する画像の大きさをスイッチ等lこより
複数種類の候補の中から選択・指示する必要がありた。
In conventional image file systems, for example, as described in Hitachi's optical disk file system operating manual (Hitachi Manual 6O-10-001-20), each operator controls the size of the image to be input using a switch or the like. Therefore, it was necessary to select and give instructions from among multiple types of candidates.

即ち、A3判とA4判の2種類の候補が用意されている
場合、例えばA4判、85判の如(A4判以下の原稿の
入力のときほはA4判を、また、A3判、84判の如く
、A4判より太き(A3判以下の原稿の入力のときEこ
はA3判を選択・指示する。この場合、入力画面はそれ
ぞれA4.A3判の画像としてファイルに格納されるた
め、85判、84判のように予め定められた候補より小
さい原稿に対しては、周囲に余白が付加されて、丁[A
4.A3判等の大きさに正規化された形でファイルに格
納されることになる。
In other words, if two types of candidates, A3 size and A4 size, are prepared, for example, A4 size and 85 size (when inputting a document smaller than A4 size, use A4 size, and A3 size and 84 size). For example, when inputting a document that is thicker than A4 size (A3 size or smaller), select and specify A3 size. In this case, the input screen will be stored as an A4 and A3 size image in the file, so For originals that are smaller than the predetermined candidates, such as 85 and 84 sizes, margins are added around the edges and the page [A
4. It will be stored in a file in a format normalized to a size such as A3 size.

〔発明が解決しようとする問題点〕[Problem that the invention seeks to solve]

上記従来方式lこよれば、予め定められた入力w像の太
きさより小さい原稿で画像を入力する場合、原稿周辺の
背景が大きな余白部分となって画像データと共にファイ
ルに格納される。また、予じめ定められた大きさの原稿
で画像を入力する場合も原稿自体が周辺部に余白を伴な
っているため、この余白部分がデータ部分と共1こファ
イルlこ格納される。このため、余白部分がファイル容
量を不当fこ必要とする問題があった。
According to the above-mentioned conventional method, when an image is input using an original whose width is smaller than a predetermined width of an input image, the background around the original becomes a large blank area and is stored in a file together with the image data. Furthermore, even when an image is input using a document of a predetermined size, since the document itself has margins around its periphery, these margins are stored together with the data portion in one file. Therefore, there is a problem in that the blank space requires an unreasonable amount of file capacity.

本発明の目的は、文書画像データのファイル容量を削減
することにある。
An object of the present invention is to reduce the file size of document image data.

〔問題点を解決するための手段〕[Means for solving problems]

上記目的を達成するため、本発明では不安な余白部分を
除外して、入力画像をファイル装置に格納するようにし
たことを特徴とする。不安な余白部分を除外するために
は、例えば、ディジタル化した文書画像データを、縦お
よび横力向fこ投影して画素濃度の累積値を求め、この
値が所定の閾値を超えるもののうち、縦方向については
、最上点および最下点、横方向lこついては最左点およ
び最左点の座標を求めればよい。
In order to achieve the above object, the present invention is characterized in that an input image is stored in a file device while excluding unsatisfactory blank areas. In order to exclude unstable blank areas, for example, digitized document image data is projected in the vertical and horizontal force directions to obtain the cumulative value of pixel density, and among those whose values exceed a predetermined threshold, In the vertical direction, the coordinates of the uppermost point and the lowermost point, and in the horizontal direction, the coordinates of the leftmost point and the leftmost point may be determined.

〔作用〕[Effect]

前記上、下、左、右点け、原稿の記載内容である文字、
図表等をすべて含む矩形のうち最小のものを表すので、
画像入力装置によって付加して取込まれた紙面外の余白
部分、および紙面自身の余白部分を除去してファイルf
こ格納することができる。また上記各点は画素濃度の累
積値を所定の閾値と比較して求めているため、余白部分
の雑音情報とは無関係(こ上記処理を達成できる。さら
lこ一般lこは紙面自身の余白部分より小さい余白を周
囲に付加してファイルに格納することもできるので、検
索時の操作性が低下することもない。
The above-mentioned top, bottom, left, and right dots, the characters that are the contents of the manuscript,
It represents the smallest rectangle that includes all figures, tables, etc., so
The file f is created by removing the margins outside the paper added by the image input device and the margins of the paper itself.
This can be stored. In addition, since each point above is determined by comparing the cumulative value of pixel density with a predetermined threshold value, it is independent of noise information in the margin area (this process can be achieved. It is also possible to add a margin smaller than the part and store it in a file, so the operability during searching does not deteriorate.

〔実施例〕〔Example〕

以下本発明の一実施例を説明する。 An embodiment of the present invention will be described below.

第1図は画像ファイルシステムのブロック構成図である
。図中、5CANは画像入力装fil 、I M B 
Mlは入力画像を格納する画像メモIJ、IMF3M2
は切出等画像変換処理を施した変換画像を格納するため
の画像メモIJ、CMEMはテーブルデータ等のコード
データを格納するためのメモ1ハFILEは画像を格納
するファイル装置、PROCはシステム全体の制御およ
び画像データに対する画像処理を行う処理装置で、内部
に格納した後述のプログラムに従って動作する装置であ
る。
FIG. 1 is a block diagram of the image file system. In the figure, 5CAN is an image input device fil, IMB
Ml is an image memo IJ that stores input images, IMF3M2
is an image memo IJ for storing converted images that have undergone image conversion processing such as cropping, CMEM is a memo 1 for storing code data such as table data, FILE is a file device that stores images, and PROC is the entire system. This is a processing device that performs image processing on image data and controls the image data, and operates according to a program that is stored internally and will be described later.

次fこ、本システムにおいて文書画像データをファイル
に格納する動作fこついて説明する。第2図は、文書画
像データの入力処理全体のフロ□−チャートで、処理装
置paocのプログラムトシて実現されるものである。
Next, the operation of storing document image data in a file in this system will be explained. FIG. 2 is a flowchart of the entire document image data input process, which is realized by the program of the processing device paoc.

ステップ21では1画像入力装置8CANで文書原稿を
光電変換し、ディジタル化して画像メモリIMEM1i
こ格納する。
In step 21, the original document is photoelectrically converted by the image input device 8CAN, digitized, and stored in the image memory IMEM1i.
Store this.

読取る範囲は、スイッチ(図示せず)等により、あらか
じめ用意された候補の中から1つを選択して指示するも
のとする。従って、一般には原稿外の背景データもIM
gMlに取込まれるステップ22〜27では、後Eこ詳
述する画像処理手段により、上記背景および文書画像の
余白を除去した有効部分の位置情報を検出し、コードメ
モIJcMEMEこ格納する。ステップ28では、本情
報Eこより画像メモIJIMEMI)こ格納された文書
画像データの部分画像を切出し、画像メモIJ M B
 M 2 tこ所定の余白データを合成して格納する。
The range to be read is specified by selecting one of the candidates prepared in advance using a switch (not shown) or the like. Therefore, in general, background data outside the manuscript is also included in the IM.
In steps 22 to 27 taken into gMl, the image processing means, which will be described in detail later, detects the positional information of the effective portion from which the background and margins of the document image have been removed, and stores the code memo IJcMEME. In step 28, a partial image of the stored document image data is cut out from the main information E and the image memo IJIMEMI) is created as an image memo IJM B
M 2 t predetermined margin data are combined and stored.

最後のステップ29では、画像メモIJIMEM2のデ
ータを上記画像メモIJIMEM2における画像データ
の横巾および縦長さの情報と共にファイル装置FIIJ
1こ格納する。
In the final step 29, the data of the image memo IJIMEM2 is sent to the file device FIIJ together with the width and height information of the image data in the image memo IJIMEM2.
Store 1 item.

次に、有効領域の検知方法を第2図を用いて説明する。Next, a method for detecting an effective area will be explained using FIG. 2.

図中31は画像メモlJMEM1の範囲に対応する枠で
、操作者が選択指示した画像入力装置8CANiこおけ
る画像読取範囲に相当する。
In the figure, 31 is a frame corresponding to the range of the image memory lJMEM1, which corresponds to the image reading range of the image input device 8CANi selected by the operator.

32は読取った原稿紙面の大きさ、35は読取った原稿
の記載内容に相当する有効領域の大きさでデータ内容で
ある文字、図形等をすべて含む矩形のうち最小のものに
相当する。まず、画像メモリMBM1領域全体31をX
方向に走査し、各行fこおける黒画素の累積値を求める
(ステップ22)。
32 is the size of the surface of the read manuscript, and 35 is the size of the effective area corresponding to the written contents of the read manuscript, which corresponds to the smallest rectangle that includes all the data contents such as characters, figures, etc. First, the entire image memory MBM1 area 31 is
The cumulative value of black pixels in each row f is determined by scanning in the direction f (step 22).

図ではこれをグラフ33で表わしているが、実際にはy
座標に対する累積値として表形式でコードメモIJCM
EMに書込む。次に、この累積値の中から、y座標が小
さいものから順に所定の閾値ε1を超えるものを探索し
、初めて超えた点y。で探索索を打切る(ステップ23
)。次1こ、同様にy座標が大きいものから逆順Eこ探
索し、点y1  を求める(ステップ24)。y座標が
y。とyl の間Eこある長さ! の部分をy方向の有
効部分とする。
In the figure, this is represented by graph 33, but in reality, y
Code memo IJCM in table format as cumulative value for coordinates
Write to EM. Next, from among these accumulated values, those whose y-coordinate exceeds a predetermined threshold ε1 are searched for in descending order, and the point y that exceeds it for the first time is found. to terminate the search (step 23
). Next, the point y1 is similarly searched in reverse order starting from the one with the largest y coordinate (step 24). The y coordinate is y. There is a certain length between E and yl! Let the part be the effective part in the y direction.

全く同様(こして、点X。とxlを求め(ステップ25
〜27)、その間にある長さj8の部分をX方向の有効
部分とする。以上の結果得られた画像データの有効部分
が枠35番こ一致する。本情報t′i、例えば、左上座
標(xo、yo)と横長さj8、縦長さj の組として
、コードメモリCMgMtこ格納する。
Exactly in the same way (Thus, find the point X. and xl (Step 25)
~27), and the portion of length j8 between them is defined as the effective portion in the X direction. The valid portion of the image data obtained as a result of the above matches frame No. 35. This information t'i, for example, is stored in the code memory CMgMt as a set of upper left coordinates (xo, yo), horizontal length j8, and vertical length j.

以上の処理は、処理装置PROC+こ格納されたプログ
ラムで実現されるが、その具体的フローチャートを第4
図1こ示す。本フローチャートは、説明を箭単にするた
め、2値画像を対象とする例について記述している。図
中ステップ401〜410は前記のy。を求める処理、
411〜420はylを求める処理に対応する。またf
(y)は画素濃度の累積値、即ち周辺密度分布を表わす
。ただし本プログラムで(まf(y)を求める処理40
4゜414と端点y。+Y1を求める処理405゜41
5を、それぞれ同一のループで行っており、探索に不用
なf(y)の計算は省略している。以上で求めた有効部
分は、文書等の内容Eこ外接する矩形1こ対応するが、
ステップ28ではあらかじめ決めた巾の余白を付加して
有効部分とする。これは具体約5こね上方の余白の幅を
a1以下、下方をb1左方をC9右方をdとすると、有
効部分の左上点は(xo−C+Yo−a)、縦長さを(
−j’。
The above processing is realized by the program stored in the processing device PROC+, and its specific flowchart is shown in the fourth section.
Figure 1 is shown. In order to simplify the explanation, this flowchart describes an example that targets a binary image. Steps 401 to 410 in the figure are the above-mentioned y. The process of finding
411 to 420 correspond to the process of calculating yl. Also f
(y) represents the cumulative value of pixel density, that is, the peripheral density distribution. However, in this program, the process 40 to obtain (maf(y))
4°414 and end point y. Process for calculating +Y1 405°41
5 are performed in the same loop, and the calculation of f(y) that is unnecessary for the search is omitted. The effective part obtained above corresponds to one rectangle that circumscribes the content E of the document, etc., but
In step 28, a margin of a predetermined width is added to make the area effective. This is concretely about 5 kneading.If the width of the upper margin is less than a1, the lower part is b1, the left side is C9, and the right side is d, the upper left point of the effective part is (xo-C+Yo-a), and the vertical length is (
−j'.

+a+b)、横長さを(j、−)−c−)−d )と定
義する。ここで求めた有効部分は枠261こ対応する。
+a+b), and the horizontal length is defined as (j, -)-c-)-d). The effective portion found here corresponds to frame 261.

なお、本フローはステップ403,413を省略ステッ
プ404,414をf (y)=f (y)+I(x、
y)(I(x、y)は点(X、y)の画素濃度)と変更
すること番こよりて、容易に濃淡画像の処理に拡張でき
る。
Note that this flow omits steps 403 and 413 and replaces steps 404 and 414 with f (y)=f (y)+I(x,
y) (I(x, y) is the pixel density of point (X, y)), it can be easily extended to the processing of grayscale images.

$5図は以上で作成した文書画像データのファイル形式
を表わす。図中、501は文書画像データの横長さであ
り、前記jx+c+dに相当する。
Figure $5 shows the file format of the document image data created above. In the figure, 501 is the horizontal length of the document image data, and corresponds to jx+c+d.

502は同じく縦長さで前記j  −1−a−1−jに
相当する。503〜505は、yo−a<y(、y。。
502 also has a vertical length and corresponds to j-1-a-1-j. 503-505 are yo-a<y(,y.

xo−c<xくx、+dの部分に相当し、それぞれ1行
分の画像データに相当する。506〜514はyo<y
<y、、x o−c<x<x1+dの部分(こ相当する
。特Eこ506.509.512は、x。
This corresponds to the portion xo−c<x x, +d, and each corresponds to one row of image data. 506 to 514 are yo<y
<y,, x oc<x<x1+d (corresponds to this.Special Eko 506.509.512 is x.

−c < x < xoの部分、507,510,51
3はX。<x<xlの部分、508,511,514i
tx、  くx<x1+dの部分に相当する。515゜
516はY、 <y<yl +b 、 Xo−c<x<
x1+dの部分(こ相当する。
-c < x < xo part, 507, 510, 51
3 is X. <x<xl part, 508, 511, 514i
tx, corresponds to the part where x<x1+d. 515°516 is Y, <y<yl +b, Xo-c<x<
The part x1+d (corresponds to this).

なお応用lこよっては、特に第3図1こおけるa〜dを
0とし、枠36を枠35に一致させることlこより、フ
ァイル容量を最小(こすることができる。
Note that, depending on the application, the file capacity can be minimized by setting a to d in FIG. 3 to 0 and making the frame 36 coincide with the frame 35.

〔発明の効果〕〔Effect of the invention〕

本発明によれば、入力した文書画像データの有効部分の
位置と大きさに関する情報を検知できるので、操作者が
これを指示することなく、有効部分のみをファイルに格
納することができる。よって文書画像ファイル容量の削
減およびこれに伴う文書画像検索速度の向上の効果があ
る。また、有効部分の周囲fこ所定の大きさの余白を付
加してファイルに格納することもできるので、検索の操
作性が低下することもない。
According to the present invention, since information regarding the position and size of the valid portion of input document image data can be detected, only the valid portion can be stored in a file without the operator instructing this. Therefore, there is an effect of reducing the document image file capacity and improving the document image search speed accordingly. Further, since it is possible to add a margin of a predetermined size around the valid portion and store it in a file, the operability of the search does not deteriorate.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の一実施例の画像ファイルシステムのブ
ロック構成図、第2図は文書画像データのファイル格納
処理のフローチャート、第3図は有効領域検知処理Eこ
おける画像メモリ内容の模式図、第4図は有効領域検知
処理のフローチャート第5図はファイルに格納する文書
画像データの形式の一例である。 8CAN・・・・・・画像入力装置、IMEMl。 IMgM2・・・・・・画像メモIJ、PROC・・・
・・・処理装置、FILE・・・・・・ファイル装置、
CMEM・・・・・・コt 1 菌 + 2 口
FIG. 1 is a block configuration diagram of an image file system according to an embodiment of the present invention, FIG. 2 is a flowchart of document image data file storage processing, and FIG. 3 is a schematic diagram of image memory contents in effective area detection processing E. , FIG. 4 is a flowchart of effective area detection processing, and FIG. 5 is an example of the format of document image data stored in a file. 8CAN... Image input device, IMEMl. IMgM2... Image memo IJ, PROC...
...Processing device, FILE...File device,
CMEM...Kot 1 bacteria + 2 mouths

Claims (1)

【特許請求の範囲】[Claims] 1、画像入力装置と、画像メモリと、処理装置とファイ
ル装置からなる文書画像ファイルにおいて、入力した文
書画像データの原稿に記載された内容を全て含む矩形の
うち最小のものを求め、この周囲に一定の大きさの余白
部分を付加した形でファイル装置に格納することを特徴
とする文書画像データのファイル方式。
1. In a document image file consisting of an image input device, image memory, processing device, and file device, find the smallest rectangle that includes all the contents written in the manuscript of the input document image data, and calculate the rectangle around this rectangle. A file method for document image data characterized by storing it in a file device with a margin of a certain size added.
JP61006414A 1986-01-17 1986-01-17 Document picture data filing system Pending JPS62165277A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61006414A JPS62165277A (en) 1986-01-17 1986-01-17 Document picture data filing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61006414A JPS62165277A (en) 1986-01-17 1986-01-17 Document picture data filing system

Publications (1)

Publication Number Publication Date
JPS62165277A true JPS62165277A (en) 1987-07-21

Family

ID=11637705

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61006414A Pending JPS62165277A (en) 1986-01-17 1986-01-17 Document picture data filing system

Country Status (1)

Country Link
JP (1) JPS62165277A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007307414A (en) * 2002-02-14 2007-11-29 Otsuka Pharmaceut Factory Inc Discharge method of medical agent

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007307414A (en) * 2002-02-14 2007-11-29 Otsuka Pharmaceut Factory Inc Discharge method of medical agent

Similar Documents

Publication Publication Date Title
JP2930612B2 (en) Image forming device
US4748678A (en) Method of storing and retrieving image data
US6043823A (en) Document processing system which can selectively extract and process regions of a document
EP0081767B1 (en) Character and image processing apparatus
US8520224B2 (en) Method of scanning to a field that covers a delimited area of a document repeatedly
JPS63268081A (en) Method and apparatus for recognizing character of document
JP3962891B2 (en) Document image processing apparatus, document image processing method, and storage medium
JP3727974B2 (en) Image processing apparatus and method
WO2001003416A1 (en) Border eliminating device, border eliminating method, and authoring device
JP4035228B2 (en) Image processing method and image processing apparatus
JPS6126150A (en) Registering and retrieving device of document picture file
JPS62165277A (en) Document picture data filing system
JPS6325391B2 (en)
US8004712B2 (en) Image processing apparatus and method
JP7031465B2 (en) Information processing equipment and programs
JP5723803B2 (en) Image processing apparatus and program
JP3604909B2 (en) Image registration method
JPS62212879A (en) Image data retrieving system
JPH07262216A (en) Picture information processor
JPH05151388A (en) Designating system for processing area and processing condition
JP3218678B2 (en) Information selection output device and method
JPS62151988A (en) File system for picture data
JP6798309B2 (en) Image processing equipment, image processing methods and programs
JPS6327751B2 (en)
JPS62164168A (en) Picture data filing system