JPH11296676A - Image data classification method and image data registration method - Google Patents

Image data classification method and image data registration method

Info

Publication number
JPH11296676A
JPH11296676A JP10095575A JP9557598A JPH11296676A JP H11296676 A JPH11296676 A JP H11296676A JP 10095575 A JP10095575 A JP 10095575A JP 9557598 A JP9557598 A JP 9557598A JP H11296676 A JPH11296676 A JP H11296676A
Authority
JP
Japan
Prior art keywords
feature information
format
image data
feature
detected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10095575A
Other languages
Japanese (ja)
Other versions
JP3648050B2 (en
Inventor
Yoshimi Nouji
善美 能塒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP09557598A priority Critical patent/JP3648050B2/en
Publication of JPH11296676A publication Critical patent/JPH11296676A/en
Application granted granted Critical
Publication of JP3648050B2 publication Critical patent/JP3648050B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Facsimiles In General (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

PROBLEM TO BE SOLVED: To efficiently detect the features of inputted image data and to classify them into corresponding formats. SOLUTION: This method is provided with a process (S101) for inputting the image data, the process (S102-S103) for detecting feature information corresponding to the feature detection item from the image data corresponding to the priority order of the predetermined feature detection item and collating the detected feature information with the feature information on the format registered beforehand and the process (S104-S106) for outputting the format in the case that the detected feature information and the format of the feature information extracted by the collation are in one-to-one correspondence.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、文字や表、写真等
の各種の画像が混在している画像データを入力し、所定
の分類や登録を行う画像データ分類方法および画像デー
タ登録方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an image data classification method and an image data registration method for inputting image data in which various images such as characters, tables and photographs are mixed and performing predetermined classification and registration.

【0002】[0002]

【従来の技術】近年、多種多様な画像が混在している画
像データを入力し、OCR(光学式文字読み取り装置)
で読み取ったり、ファイリングシステムで格納管理する
画像処理システムが考えられているが、この画像処理シ
ステムでは、入力した画像データを所定の特徴に基づい
て分類する処理が行われている。
2. Description of the Related Art In recent years, image data in which a variety of images are mixed is input, and an OCR (optical character reading device) is input.
An image processing system that reads data by using a filing system or stores and manages the image data by a filing system is considered. In this image processing system, a process of classifying input image data based on predetermined characteristics is performed.

【0003】すなわち、画像処理システムでは、イメー
ジスキャナやファクシミリなどの画像入力装置で画像デ
ータの入力を行うにあたり、オペレータによって入力す
る画像の種類を予め指定したり、画像の種類を判別する
ためのシート(バッチ票など)を付加したり、画像入力
するシートに分類用のID(識別符号)を付けたりして
いる。
That is, in an image processing system, when inputting image data with an image input device such as an image scanner or a facsimile, a type of image to be input is designated in advance by an operator, and a sheet for determining the type of image is used. (Eg, a batch slip), and a classification ID (identification code) is attached to the sheet for image input.

【0004】また、最近では、分類対象となる画像デー
タの罫線の特徴を抽出し、その特徴をその画像のフォー
マットとして予め登録、分類しておき、新たな画像デー
タが入力された場合にその画像データの罫線の特徴と、
登録されているフォーマットの罫線の特徴とを照らし合
わせてフォーマットを特定し、分類を行うことも考えら
れている。
Further, recently, the features of ruled lines of image data to be classified are extracted, and the characteristics are registered and classified in advance as the format of the image, and when new image data is input, the image is deleted. Features of the ruled line of the data,
It is also considered that the format is specified by comparing it with the features of the ruled lines of the registered format, and classification is performed.

【0005】[0005]

【発明が解決しようとする課題】しかしながら、このよ
うに罫線の特徴によってフォーマットを特定する方法に
は次のような問題がある。すなわち、イメージスキャナ
やファクシミリ等の画像入力装置で画像データの入力を
行った場合、その解像度の関係から入力されるシートの
罫線の太さや色、濃さ等の種々の条件によって画像デー
タとして罫線が完全な型で現れないこともあり、罫線の
特徴を十分に検出できないという問題が生じる。
However, the method for specifying the format based on the characteristics of the ruled line has the following problems. That is, when image data is input by an image input device such as an image scanner or a facsimile, the ruled line is formed as image data depending on various conditions such as the thickness, color, and density of the ruled line of the input sheet based on the resolution. There is a problem that the feature of the ruled line cannot be sufficiently detected because it may not appear in a perfect pattern.

【0006】この場合、入力されるシートの罫線の特徴
が近似しているとその区別が困難となる。一般に事務や
会計、為替などの業務で使用されている帳票は、その罫
線の特徴が似ており、罫線の特徴だけではその帳票のフ
ォーマットを正確に特定できない。
In this case, if the features of the ruled lines of the input sheet are similar, it is difficult to distinguish them. In general, forms used in business such as office work, accounting, and exchange have similar characteristics of the ruled lines, and the format of the form cannot be accurately specified only by the characteristics of the ruled lines.

【0007】そこで、罫線の特徴以外に、帳票のサイ
ズ、色、地紋、特徴となる領域の文字認識結果、パター
ンマッチング、黒点検出結果、文字検出結果、字種検出
結果などの他の特徴項目を追加、組み合わせることで正
確にそのフォーマットを特定することも考えられてい
る。
Therefore, in addition to the characteristics of the ruled lines, other characteristic items such as the size, color, copy-forgery-inhibited pattern, character recognition result of the characteristic region, pattern matching, black dot detection result, character detection result, and character type detection result are included in the form. It is also conceivable to specify the format correctly by adding and combining.

【0008】このように多くの特徴を用いて入力した画
像データの特徴検出を行えば、類似する画像データの分
類を正確に行うことはできるものの、特徴の登録が多く
なるほど特徴検出に時間がかかり、フォーマットの特定
にも多くの時間を要することになる。また、多くの特徴
を登録しておくことによって、大きなメモリ容量を確保
する必要が生じてしまう。
[0008] By performing feature detection of input image data using many features as described above, similar image data can be accurately classified, but the more features are registered, the longer the feature detection takes. However, it takes a lot of time to specify the format. Also, by registering many features, it becomes necessary to secure a large memory capacity.

【0009】[0009]

【課題を解決するための手段】本発明はこのような課題
を解決するために成された画像データ分類方法および画
像データ登録方法である。すなわち、本発明の画像デー
タ分類方法は、画像データを入力する工程と、予め定め
られた特徴検出項目の優先順に従って画像データの中か
らその特徴検出項目に対応した特徴情報を検出し、その
検出された特徴情報と予め登録されているフォーマット
の特徴情報とを照合する工程と、検出された特徴情報と
照合によって抽出された特徴情報のフォーマットとが1
対1に対応する場合、そのフォーマットを出力する工程
とを備えている。
SUMMARY OF THE INVENTION The present invention relates to a method for classifying image data and a method for registering image data which have been made to solve such problems. That is, the image data classification method of the present invention includes a step of inputting image data, and detecting feature information corresponding to the feature detection item from the image data in accordance with a predetermined priority order of the feature detection item. Comparing the detected feature information with the feature information in a pre-registered format; and detecting the detected feature information and the format of the feature information extracted by the matching.
Outputting the format when the correspondence is one-to-one.

【0010】このような本発明では、予め定められた特
徴検出項目の優先順に従って画像データの特徴情報を検
出し、その検出された特徴情報と予め登録されているフ
ォーマットの特徴情報とを照合しており、その検出され
た特徴情報と照合によって抽出された特徴情報のフォー
マットとが1対1に対応する場合、そのフォーマットを
出力している。このため、フォーマットが出力された段
階でそれより後の優先順となっている特徴検出項目に対
応した特徴情報を検出する必要がなくなり、効率良くフ
ォーマットの特定を行うことができるようになる。
According to the present invention, characteristic information of image data is detected in accordance with a predetermined priority order of characteristic detection items, and the detected characteristic information is compared with characteristic information of a format registered in advance. If the detected feature information and the format of the feature information extracted by collation correspond one-to-one, the format is output. For this reason, it is not necessary to detect the feature information corresponding to the feature detection item having the priority order after the format is output, and the format can be specified efficiently.

【0011】また、本発明の画像データ登録方法は、画
像データを入力する工程と、予め定められた特徴検出項
目の優先順に従って画像データの中からその特徴検出項
目に対応した特徴情報を検出し、その検出された特徴情
報と予め登録されているフォーマットの特徴情報とを照
合する工程と、この照合により、検出された特徴情報が
フォーマットの特徴情報から抽出されなかった場合に、
その検出された特徴情報をそれに対応する特徴検出項目
の新たな特徴情報として登録する工程とを備えている。
The image data registration method according to the present invention comprises the steps of: inputting image data; and detecting feature information corresponding to the feature detection item from the image data in accordance with a predetermined priority order of the feature detection item. A step of comparing the detected characteristic information with the characteristic information of a format registered in advance, and, if the detected characteristic information is not extracted from the characteristic information of the format,
Registering the detected feature information as new feature information of the corresponding feature detection item.

【0012】このような本発明では、予め定められた特
徴検出項目の優先順に従って画像データの特徴情報とを
照合しており、この照合、先に検出された特徴情報が予
め登録されているフォーマットの特徴情報から抽出され
なかった場合に、その特徴情報を対応する特徴検出項目
の新たな特徴情報として登録していることから、重要度
の高い特徴検出項目に対応する特徴情報を優先的に登録
できるようになる。
In the present invention, the feature information of the image data is collated in accordance with a predetermined priority order of the feature detection items, and the collation is performed, and a format in which the previously detected feature information is registered in advance. If the feature information is not extracted from the feature information, the feature information is registered as new feature information of the corresponding feature detection item, so the feature information corresponding to the feature detection item with high importance is preferentially registered. become able to.

【0013】[0013]

【発明の実施の形態】以下に、本発明の画像データ分類
方法および画像データ登録方法における実施の形態を図
に基づいて説明する。先ず、本発明の画像データ分類方
法における実施形態を説明する。図1は本実施形態に係
る画像データ分類方法を説明するフローチャート、図2
は画像データ分類方法を実現するためのハードウェア構
成図である。
DESCRIPTION OF THE PREFERRED EMBODIMENTS Embodiments of the image data classification method and the image data registration method of the present invention will be described below with reference to the drawings. First, an embodiment of the image data classification method of the present invention will be described. FIG. 1 is a flowchart illustrating an image data classification method according to the present embodiment.
FIG. 2 is a hardware configuration diagram for realizing an image data classification method.

【0014】すなわち、図2に示すように、本実施形態
における画像データ分類方法を実現するハードウェア
は、主として画像入力部1、画像データ格納メモリ2、
特徴優先順位情報格納メモリ3、特徴検出部4、特徴格
納メモリ5、フォーマット登録メモリ6、フォーマット
分類部7、フォーマット分類結果格納メモリ8から構成
されている。
That is, as shown in FIG. 2, the hardware for realizing the image data classification method in this embodiment mainly includes an image input unit 1, an image data storage memory 2,
It comprises a feature priority information storage memory 3, a feature detection unit 4, a feature storage memory 5, a format registration memory 6, a format classification unit 7, and a format classification result storage memory 8.

【0015】画像入力部1は、分類対象となる帳票やシ
ート等の画像を読み込むスキャナやファクシミリから成
り、読み込んだ画像データを画像データ格納メモリ2へ
格納する機能を備えている。
The image input unit 1 is composed of a scanner or a facsimile that reads an image of a form or a sheet to be classified, and has a function of storing the read image data in the image data storage memory 2.

【0016】画像データ格納メモリ2は、画像入力部1
で入力した画像データを格納するメモリである。特徴優
先順位情報格納メモリ3は、分類対象となる画像データ
を分類するための項目となる特徴検出項目とその優先順
位との対応を格納するメモリである。この優先順位とし
ては、分類対象の画像データの特徴におけるばらつきや
特徴検出の難易度(処理時間、リソース)などによって
異なるものである。
The image data storage memory 2 includes an image input unit 1
Is a memory for storing the image data input in step (1). The feature priority information storage memory 3 is a memory for storing correspondence between feature detection items, which are items for classifying image data to be classified, and their priorities. The priority order differs depending on the variation in the characteristics of the image data to be classified, the difficulty level of the feature detection (processing time, resources), and the like.

【0017】特徴検出部4は、優先順位の設定された特
徴検出項目の数だけ特徴情報を検出するよう用意されて
いる。例えば、特徴検出項目として帳票のサイズが設定
されている場合、特徴検出部4では、画像入力部1で入
力し画像データ格納メモリ2に格納された画像データを
用いて帳票のサイズ(縦横の画像の大きさ)を検出し、
その検出値を特徴情報として出力する。同様に、特徴検
出部4では、設定されている特徴検出項目毎にその特徴
情報を検出するようにしている。
The feature detecting section 4 is provided so as to detect feature information by the number of feature detection items for which the priority order is set. For example, when the form size is set as a feature detection item, the feature detection unit 4 uses the image data input by the image input unit 1 and stored in the image data storage memory 2 to determine the size of the form (vertical and horizontal images). Of the size)
The detected value is output as feature information. Similarly, the feature detection unit 4 detects the feature information for each set feature detection item.

【0018】特徴格納メモリ5は、特徴検出部4で検出
した特徴情報を格納するメモリであり、特徴検出項目の
数に対応して用意されている。フォーマット登録メモリ
6は、分類の対象となる画像データから予め検出された
特徴情報を登録しておくメモリであり、分類を行うため
の基準となるフォーマットの特徴情報が登録されてい
る。
The feature storage memory 5 is a memory for storing feature information detected by the feature detection unit 4, and is prepared corresponding to the number of feature detection items. The format registration memory 6 is a memory in which characteristic information detected in advance from image data to be classified is registered, and characteristic information of a format serving as a reference for performing classification is registered.

【0019】フォーマット分類部7は、特徴格納メモリ
5に格納された画像データの特徴情報と、フォーマット
登録メモリ6に予め登録されたフォーマットの特徴情報
とを照合し、1つまたは複数のフォーマットを選択する
機能を備えている。
The format classification unit 7 compares the feature information of the image data stored in the feature storage memory 5 with the feature information of the format registered in advance in the format registration memory 6 and selects one or a plurality of formats. It has the function to do.

【0020】また、フォーマット分類結果格納メモリ8
は、フォーマット分類部7で選択したフォーマットの情
報を格納するメモリである。
A format classification result storage memory 8
Is a memory for storing information of the format selected by the format classification unit 7.

【0021】次に、本実施形態における画像データ分類
方法を図1のフローチャートに沿って説明する。なお、
以下の説明で図1に示されない符号は図2を参照するも
のとする。また、本実施形態では、画像データの分類を
行うにあたり、フォーマット登録メモリ6に格納された
フォーマットとして、図3〜に示す4つのフォーマ
ットが格納されているものとする。
Next, an image data classification method according to this embodiment will be described with reference to the flowchart of FIG. In addition,
In the following description, reference numerals not shown in FIG. 1 refer to FIG. In the present embodiment, when classifying image data, it is assumed that four formats shown in FIGS. 3 to 3 are stored as formats stored in the format registration memory 6.

【0022】ここで、フォーマットは、フォーマット
、、と比べて帳票サイズが相違し、フォーマット
は、フォーマット、と比べて帳票タイトルが相違
し、フォーマットは、フォーマットと比べて罫線の
型が相違している。
Here, the format has a different form size than the format, the format has a different form title than the format, and the format has a different ruled line type than the format. .

【0023】先ず、画像入力部1によって分類対象とな
る画像データ(帳票画像)を入力し、画像データ格納メ
モリ2に格納する(ステップS101)。次に、特徴優
先順位情報格納メモリ3から最も優先順位の高い特徴検
出項目を取得し(ステップS102)、特徴検出部4に
よってその特徴検出項目における特徴情報を得る(ステ
ップS103)。
First, image data (form image) to be classified is input by the image input unit 1 and stored in the image data storage memory 2 (step S101). Next, the feature detection item having the highest priority is acquired from the feature priority information storage memory 3 (step S102), and the feature information of the feature detection item is obtained by the feature detection unit 4 (step S103).

【0024】特徴検出部4で検出された画像データの最
も優先順位の高い特徴検出項目における特徴情報は、特
徴格納メモリ3内に格納される。
The feature information of the feature detection item having the highest priority of the image data detected by the feature detection unit 4 is stored in the feature storage memory 3.

【0025】次に、フォーマット分類部7によって特徴
格納メモリ3内に格納された特徴情報とフォーマット登
録メモリ6に格納された各フォーマットの特徴情報とを
照合する(ステップS104)。この照合によって画像
データの特徴情報と合う特徴情報を備えたフォーマット
が1つだけ(1対1)か否かの判断を行う(ステップS
105)。
Next, the feature information stored in the feature storage memory 3 is compared with the feature information of each format stored in the format registration memory 6 by the format classification unit 7 (step S104). By this comparison, it is determined whether there is only one format (one-to-one) having the feature information matching the feature information of the image data (step S).
105).

【0026】特徴情報の合うフォーマットが1つだけの
場合は、入力した画像データがそのフォーマットである
と判断し、決定したフォーマットをフォーマット分類結
果格納メモリ8へ出力する(ステップS106)。
If there is only one format that matches the characteristic information, it is determined that the input image data is that format, and the determined format is output to the format classification result storage memory 8 (step S106).

【0027】一方、画像データの特徴情報と合う特徴情
報を備えたフォーマットが2つ以上(1対n)ある場合
は、次の優先順位となる特徴検出項目があるか否かの判
断を行い(ステップS107)、ある場合にはステップ
S102〜ステップS105の処理を繰り返し行う。す
なわち、次の優先順位となる特徴検出項目について入力
した画像データから特徴情報を検出し、フォーマット分
類部7でその特徴情報と先に選択された2つ以上の各フ
ォーマットのその特徴検出項目に対応した特徴情報とを
照合する。
On the other hand, if there are two or more formats (1: n) having the feature information matching the feature information of the image data, it is determined whether or not there is a feature detection item having the next priority. Step S107) In some cases, the processing of steps S102 to S105 is repeated. That is, feature information is detected from the input image data for the feature detection item having the next priority, and the format classification unit 7 corresponds to the feature information and the feature detection item of each of the two or more previously selected formats. Is compared with the obtained feature information.

【0028】このような画像データの特徴情報とフォー
マットの特徴情報との照合を特徴検出項目に付された優
先順位に従って行い、最終的に1つのフォーマットが決
定した時点でそのフォーマットをフォーマット分類結果
格納メモリ8へ出力する。また、全ての特徴検出項目に
おける特徴情報の照合を行っても1つのフォーマットが
決定しない場合には、分類不可としてその時点で選択さ
れている複数のフォーマットをフォーマット分類結果格
納メモリ8へ出力する(ステップS108)。
The characteristic information of the image data is compared with the characteristic information of the format in accordance with the priority assigned to the characteristic detection item. When one format is finally determined, the format is stored as a format classification result. Output to the memory 8. If one format is not determined even if the feature information of all the feature detection items is checked, a plurality of formats selected at that time are output to the format classification result storage memory 8 as unclassifiable (see FIG. 3). Step S108).

【0029】これにより、優先順位に従って画像データ
の特徴情報を検出し、効率良くフォーマットの決定を行
うことが可能となる。つまり、優先順位の高い特徴検出
項目の順に画像データの特徴情報を検出していくことか
ら、フォーマットが決定した時点でそれより優先順位の
低い特徴検出項目における特徴情報の検出を行う必要が
なくなり、無駄が照合を行わずに迅速な分類が可能とな
る。
Thus, it is possible to detect the characteristic information of the image data in accordance with the order of priority and determine the format efficiently. That is, since the feature information of the image data is detected in the order of the feature detection items having the higher priority, it is not necessary to detect the feature information of the feature detection items having the lower priority when the format is determined. It is possible to quickly classify waste without performing collation.

【0030】次に、本実施形態の具体例を説明する。図
4は特徴検出項目とその優先順位との対応例を示す図、
図5は分類対象となる画像データの例を示す図である。
すなわち、図4に示すように、特徴検出項目として、
「帳票サイズ」、「帳票タイトル」、「罫線特徴」が設
定され、この順に優先順位が設けられており、図5に示
すような画像データを入力してその分類を行う場合、先
ず、第1の特徴である「帳票サイズ」を検出する。
Next, a specific example of this embodiment will be described. FIG. 4 is a diagram showing an example of correspondence between feature detection items and their priorities,
FIG. 5 is a diagram illustrating an example of image data to be classified.
That is, as shown in FIG.
“Form size”, “form title”, and “ruled line feature” are set, and priorities are set in this order. When inputting image data as shown in FIG. The "form size", which is a feature of the above, is detected.

【0031】図5に示す帳票では、その帳票サイズが図
3に示すフォーマット、、と一致していることか
ら(1対n)、1つのフォーマットを決定することがで
きない。そこで、次の優先順位となっている第2の特徴
「帳票タイトル」の検出を行う。
In the form shown in FIG. 5, since the form size matches the format shown in FIG. 3, (1 to n), one format cannot be determined. Therefore, the second feature “form title” having the next priority is detected.

【0032】「帳票タイトル」は、入力した画像データ
の所定位置(座標)にある文字を認識することで得るこ
とができる。図5に示す帳票では、「帳票タイトル」と
して「入金伝票」を認識することができる。
The "form title" can be obtained by recognizing a character at a predetermined position (coordinate) of the input image data. In the form shown in FIG. 5, "payment slip" can be recognized as "form title".

【0033】そして、先に選択された図3に示すフォー
マット、、の中で、「帳票タイトル」が「入金伝
票」となっているものを探す。ここではフォーマット
の「帳票タイトル」が「入金伝票」であり、他のフォー
マット、は異なることから、1つのフォーマットだ
けが選択されることになる(1対1)。
Then, among the formats shown in FIG. 3 which have been previously selected, a search is made for one whose “form title” is “payment slip”. Here, the "form title" of the format is "payment slip", and since the other formats are different, only one format is selected (one-to-one).

【0034】つまり、この場合には第3の特徴である
「罫線特徴」を検出することなく、第1、第2の特徴を
検出すれば1つのフォーマットを選択でき、入力した
画像データの分類としてフォーマットであることを決
定できるようになる。
That is, in this case, one format can be selected by detecting the first and second features without detecting the "ruled line feature" which is the third feature. You will be able to determine the format.

【0035】次に、本発明の画像データ登録方法におけ
る実施形態を説明する。図6は本実施形態に係る画像デ
ータ登録方法を実現するためのハードウェア構成図、図
7は本実施形態に係る画像データ登録方法を説明するフ
ローチャートである。この画像データ登録方法は、先に
説明した画像データ分類方法で分類の基準となるフォー
マットの特徴情報を新たに登録するものである。
Next, an embodiment of the image data registration method of the present invention will be described. FIG. 6 is a hardware configuration diagram for realizing the image data registration method according to the present embodiment, and FIG. 7 is a flowchart illustrating the image data registration method according to the present embodiment. This image data registration method newly registers feature information of a format serving as a reference for classification in the image data classification method described above.

【0036】図6に示すように、本実施形態における画
像データ登録方法を実現するハードウェアは、主として
画像入力部1、画像データ格納メモリ2、特徴優先順位
情報格納メモリ3、特徴検出部4、特徴格納メモリ5、
フォーマット登録メモリ6、フォーマット分類部7、フ
ォーマット特徴決定部9、フォーマット登録部10から
構成されている。
As shown in FIG. 6, the hardware for realizing the image data registration method in the present embodiment mainly includes an image input unit 1, an image data storage memory 2, a feature priority information storage memory 3, a feature detection unit 4, Feature storage memory 5,
It comprises a format registration memory 6, a format classification unit 7, a format feature determination unit 9, and a format registration unit 10.

【0037】画像入力部1は、登録対象となる帳票やシ
ート等の画像を読み込むスキャナやファクシミリから成
り、読み込んだ画像データを画像データ格納メモリ2へ
格納する機能を備えている。
The image input unit 1 comprises a scanner or facsimile for reading an image of a form or a sheet to be registered, and has a function of storing the read image data in the image data storage memory 2.

【0038】画像データ格納メモリ2は、画像入力部1
で入力した画像データを格納するメモリである。特徴優
先順位情報格納メモリ3は、登録対象となる画像データ
の特徴情報を得るための項目となる特徴検出項目とその
優先順位との対応を格納するメモリである。この優先順
位としては、登録対象の画像データの特徴におけるばら
つきや特徴検出の難易度(処理時間、リソース)などに
よって異なるものである。
The image data storage memory 2 includes an image input unit 1
Is a memory for storing the image data input in step (1). The feature priority information storage memory 3 is a memory for storing correspondence between feature detection items, which are items for obtaining feature information of image data to be registered, and their priorities. The priority order differs depending on the variation in the characteristics of the image data to be registered, the difficulty of feature detection (processing time, resources), and the like.

【0039】特徴検出部4は、優先順位の設定された特
徴検出項目の数だけ特徴情報を検出するよう用意されて
いる。例えば、特徴検出項目として帳票のサイズが設定
されている場合、特徴検出部4では、画像入力部1で入
力し画像データ格納メモリ2に格納された画像データを
用いて帳票のサイズ(縦横の画像の大きさ)を検出し、
その検出値を特徴情報として出力する。同様に、特徴検
出部4では、設定されている特徴検出項目毎にその特徴
情報を検出するようにしている。
The feature detecting section 4 is provided so as to detect feature information by the number of feature detection items for which the priority order is set. For example, when the form size is set as a feature detection item, the feature detection unit 4 uses the image data input by the image input unit 1 and stored in the image data storage memory 2 to determine the size of the form (vertical and horizontal images). Of the size)
The detected value is output as feature information. Similarly, the feature detection unit 4 detects the feature information for each set feature detection item.

【0040】特徴格納メモリ5は、特徴検出部4で検出
した特徴情報を格納するメモリであり、特徴検出項目の
数に対応して用意されている。フォーマット登録メモリ
6は、登録対象となる画像データから予め検出された特
徴情報を登録しておくメモリであり、分類や新たな登録
を行うための基準となるフォーマットの特徴情報が登録
されている。
The feature storage memory 5 is a memory for storing the feature information detected by the feature detection unit 4, and is prepared corresponding to the number of feature detection items. The format registration memory 6 is a memory in which characteristic information detected in advance from image data to be registered is registered, and characteristic information of a format serving as a reference for classification and new registration is registered.

【0041】フォーマット分類部7は、特徴格納メモリ
5に格納された画像データの特徴情報と、フォーマット
登録メモリ6に予め登録されたフォーマットの特徴情報
とを照合し、該当するフォーマットがあるか否かの判断
を行う機能を備えている。
The format classification unit 7 compares the feature information of the image data stored in the feature storage memory 5 with the feature information of the format registered in the format registration memory 6 in advance, and determines whether there is a corresponding format. It has a function to make a judgment.

【0042】フォーマット特徴決定部9は、フォーマッ
ト分類部7で該当するフォーマットがないと判断した場
合に、そこまでで検出した特徴情報をこの画像データの
フォーマットにおける特徴情報として決定する機能を持
っている。
When the format classifying section 7 determines that there is no corresponding format, the format feature determining section 9 has a function of determining feature information detected so far as feature information in the format of the image data. .

【0043】フォーマット登録部10は、フォーマット
特徴決定部9で決定した特徴情報をその画像データのフ
ォーマットとしてフォーマット登録メモリ6に登録する
機能を備えている。
The format registration unit 10 has a function of registering the feature information determined by the format feature determination unit 9 in the format registration memory 6 as a format of the image data.

【0044】次に、本実施形態における画像データ登録
方法を図7のフローチャートに沿って説明する。なお、
以下の説明で図7に示されない符号は図6を参照するも
のとする。また、本実施形態では、画像データの登録を
行うにあたり、フォーマット登録メモリ6にフォーマッ
トとして、図3〜に示す4つのフォーマットが既に
格納されているものとする。
Next, the image data registration method according to the present embodiment will be described with reference to the flowchart of FIG. In addition,
In the following description, reference numerals not shown in FIG. 7 refer to FIG. Further, in the present embodiment, when registering image data, it is assumed that the format registration memory 6 has already stored the four formats shown in FIGS.

【0045】ここで、フォーマットは、フォーマット
、、と比べて帳票サイズが相違し、フォーマット
は、フォーマット、と比べて帳票タイトルが相違
し、フォーマットは、フォーマットと比べて罫線の
型が相違している。
Here, the format has a different form size than the format, the format has a different form title than the format, and the format has a different ruled line type than the format. .

【0046】先ず、画像入力部1によって登録対象とな
る画像データ(帳票画像)を入力し、画像データ格納メ
モリ2に格納する(ステップS201)。次に、特徴優
先順位情報格納メモリ3から最も優先順位の高い特徴検
出項目を取得し(ステップS202)、特徴検出部4に
よってその特徴検出項目における特徴情報を得る(ステ
ップS203)。
First, image data (form image) to be registered is input by the image input unit 1 and stored in the image data storage memory 2 (step S201). Next, the feature detection item having the highest priority is obtained from the feature priority information storage memory 3 (step S202), and the feature detection section 4 obtains feature information of the feature detection item (step S203).

【0047】特徴検出部4で検出された画像データの最
も優先順位の高い特徴検出項目における特徴情報は、特
徴格納メモリ3内に格納される。
The feature information of the feature detection item having the highest priority of the image data detected by the feature detection unit 4 is stored in the feature storage memory 3.

【0048】次に、フォーマット分類部7によって特徴
格納メモリ3内に格納された特徴情報とフォーマット登
録メモリ6に格納された各フォーマットの特徴情報とを
照合する(ステップS104)。この照合によって画像
データの特徴情報と同じ特徴情報があるか否かを判断し
(ステップS205)、ない場合にはその画像データの
特徴情報を新たな特徴情報としてフォーマット登録メモ
リ6へ追加登録する(ステップS206)。
Next, the feature information stored in the feature storage memory 3 is compared with the feature information of each format stored in the format registration memory 6 by the format classification unit 7 (step S104). By this collation, it is determined whether or not there is the same feature information as the feature information of the image data (step S205). If not, the feature information of the image data is additionally registered as new feature information in the format registration memory 6 (step S205). Step S206).

【0049】一方、画像データの特徴情報と同じ特徴情
報がある場合には、次の優先順位となる特徴検出項目が
あるか否かの判断を行い(ステップS207)、ある場
合にはステップS202〜ステップS205の処理を繰
り返し行う。すなわち、次の優先順位となる特徴検出項
目について入力した画像データから特徴情報を検出し、
フォーマット分類部7でその特徴情報と同じ特徴情報が
あるか否かを判断する。
On the other hand, if there is the same feature information as that of the image data, it is determined whether or not there is a feature detection item having the next priority (step S207). Step S205 is repeatedly performed. That is, feature information is detected from the input image data for the feature detection item having the next priority,
The format classification unit 7 determines whether or not there is the same feature information as the feature information.

【0050】同じ特徴情報がない場合にはその画像デー
タの特徴情報を新たにフォーマット登録メモリ6へ追加
登録する。また、全ての優先順位における特徴検出項目
について画像データの特徴情報を検出し、各特徴情報が
既にフォーマット登録メモリ6に登録されている場合に
は、そのフォーマット登録メモリ6に登録されている特
徴検出項目の特徴情報だけではフォーマットの決定がで
きないことから、新たな特徴検出項目の追加を促すよう
にする(ステップS208)。
If the same feature information does not exist, the feature information of the image data is newly registered in the format registration memory 6. Further, feature information of image data is detected for feature detection items in all priorities, and when each feature information is already registered in the format registration memory 6, the feature detection information registered in the format registration memory 6 is detected. Since the format cannot be determined only by the feature information of the item, the user is prompted to add a new feature detection item (step S208).

【0051】これにより、優先順位に従って画像データ
の特徴情報を検出し、効率良く新たな特徴情報を登録す
ることが可能となる。すなわち、優先順位に従って特徴
検出項目に対応した特徴情報を優先的に登録することが
できるようになる。
Thus, the feature information of the image data can be detected in accordance with the priority order, and new feature information can be registered efficiently. That is, the feature information corresponding to the feature detection item can be preferentially registered according to the priority order.

【0052】次に、本実施形態の具体例を説明する。図
8は登録対象となる画像データ(帳票)の例を示す図で
ある。なお、この具体例において特徴検出項目の優先順
位としては図4に示すものを用いるとする。
Next, a specific example of this embodiment will be described. FIG. 8 is a diagram showing an example of image data (form) to be registered. Note that in this specific example, the priority shown in FIG. 4 is used as the priority of the feature detection items.

【0053】先ず、図8に示すような画像データを入力
し、第1の特徴である「帳票サイズ」を検出する。図8
に示す帳票では、その帳票サイズが図3に示すフォーマ
ット〜のうちいずれにも一致しないことから、この
「帳票サイズ」を新たな特徴情報としてフォーマット登
録メモリ6に追加登録することになる。
First, image data as shown in FIG. 8 is input, and "form size", which is the first feature, is detected. FIG.
Since the form size does not match any of the formats shown in FIG. 3, this "form size" is additionally registered in the format registration memory 6 as new feature information.

【0054】この例では、第1の特徴である「帳票サイ
ズ」を検出するだけでフォーマットと一致する特徴情報
がないことを判断できるため、「帳票サイズ」のみをフ
ォーマットの新たな特徴情報として追加登録することに
なる。これによって、予め設定された優先順位に従い、
重要度の高い特徴検出項目に対応した新たな特徴情報を
迅速に登録できるようになる。
In this example, since it is possible to determine that there is no feature information matching the format only by detecting the “form size” as the first feature, only “form size” is added as new feature information of the format. I will register. Thereby, according to the priority set in advance,
New feature information corresponding to feature detection items with high importance can be quickly registered.

【0055】また、ユーザが新たなフォーマットを登録
するにあたり、新たな特徴検出項目を追加設定した場合
には、その追加した特徴検出項目に対して図7に示すス
テップS201〜ステップS208の処理を実行すれば
よい。
When the user sets a new feature detection item when registering a new format, the processes of steps S201 to S208 shown in FIG. 7 are executed for the added feature detection item. do it.

【0056】また、図7に示す登録処理では、特徴検出
項目の優先順位に従って画像データの特徴情報と既に登
録されたフォーマットの特徴情報とが一致しない場合に
その画像データの特徴情報を新たに登録し、それより優
先順位の低い特徴検出項目については登録しないように
しているが、図7に示す登録処理を任意の回数繰り返す
ことによって、その回数分の優先順位に対応した特徴検
出項目における特徴情報を登録できるようになる。
In the registration process shown in FIG. 7, if the feature information of the image data does not match the feature information of the already registered format in accordance with the priority of the feature detection item, the feature information of the image data is newly registered. The feature detection items with lower priorities are not registered. However, by repeating the registration process shown in FIG. 7 an arbitrary number of times, the feature information items in the feature detection items corresponding to the priorities for the number of times are not registered. Can be registered.

【0057】なお、上記説明した各実施形態では、いず
れも帳票に対する分類、登録を行う例を説明したが、本
発明はこれに限定されず、他の種類の画像データ(写真
や線画を含む)に対する分類、登録を行う場合であって
も適用可能である。例えば、各種のフォームから成る名
刺を読み取り、会社名や所属部署名を特徴検出項目とし
て分類したり、写真入り名刺か否かによって分類するよ
うにしてもよい。
In each of the above-described embodiments, an example has been described in which classification and registration are performed on a form. However, the present invention is not limited to this, and other types of image data (including photographs and line drawings) are included. The present invention can be applied even when classifying and registering. For example, a business card composed of various forms may be read, and a company name or a department name may be classified as a feature detection item, or a business card with a photo may be classified.

【0058】[0058]

【発明の効果】以上説明したように、本発明の画像デー
タ分類方法および画像データ登録方法によれば次のよう
な効果がある。すなわち、複数の特徴検出項目に対して
優先順位を付け、この優先順位に従って画像データの特
徴情報を検出することから、無駄な特徴情報を検出を行
うことなく画像データのフォーマットを効率良く決定で
きるようになる。また、フォーマット決定に必要な重要
度の高い特徴検出項目の特徴情報を迅速に登録すること
ができ、新たなフォーマットの特徴を登録する場合にも
必要なデータ量だけで効率良く特徴情報を格納すること
が可能となる。
As described above, according to the image data classification method and the image data registration method of the present invention, the following effects can be obtained. That is, priorities are assigned to a plurality of feature detection items, and the feature information of the image data is detected according to the priorities, so that the format of the image data can be efficiently determined without detecting useless feature information. become. In addition, feature information of a feature detection item having a high degree of importance required for format determination can be quickly registered, and feature information can be efficiently stored with only a necessary data amount when a feature of a new format is registered. It becomes possible.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本実施形態の画像データ分類方法を説明するフ
ローチャートである。
FIG. 1 is a flowchart illustrating an image data classification method according to an embodiment.

【図2】本実施形態の画像データ分類方法を実現するた
めのハードウェア構成図である。
FIG. 2 is a hardware configuration diagram for realizing the image data classification method of the present embodiment.

【図3】格納されたフォーマットの例を示す図である。FIG. 3 is a diagram showing an example of a stored format.

【図4】特徴検出項目とその優先順位との対応例を示す
図である。
FIG. 4 is a diagram showing an example of correspondence between feature detection items and their priorities.

【図5】分類対象の帳票の例を示す図である。FIG. 5 is a diagram showing an example of a form to be classified.

【図6】本実施形態の画像データ登録方法を実現するた
めのハードウェア構成図である。
FIG. 6 is a hardware configuration diagram for realizing the image data registration method of the embodiment.

【図7】本実施形態の画像データ登録方法を説明するフ
ローチャートである。
FIG. 7 is a flowchart illustrating an image data registration method according to the embodiment.

【図8】登録対象の帳票の例を示す図である。FIG. 8 is a diagram showing an example of a form to be registered.

【符号の説明】[Explanation of symbols]

1 画像入力部 2 画像データ格納メモリ 3 特徴優先順位情報格納メモリ 4 特徴検出部 5 特徴格納メモリ 6 フォーマット登録メモリ 7 フォーマット分類部 8 フォーマット分類結果格納メモリ 9 フォーマット特徴決定部 10 フォーマット登録部 DESCRIPTION OF SYMBOLS 1 Image input part 2 Image data storage memory 3 Feature priority information storage memory 4 Feature detection part 5 Feature storage memory 6 Format registration memory 7 Format classification part 8 Format classification result storage memory 9 Format characteristic determination part 10 Format registration part

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 画像データを入力する工程と、 予め定められた特徴検出項目の優先順に従って前記画像
データの中からその特徴検出項目に対応した特徴情報を
検出し、その検出された特徴情報と予め登録されている
フォーマットの特徴情報とを照合する工程と、 前記検出された特徴情報と前記照合によって抽出された
特徴情報のフォーマットとが1対1に対応する場合、そ
のフォーマットを出力する工程とを備えていることを特
徴とする画像データ分類方法。
A step of inputting image data; detecting characteristic information corresponding to the characteristic detection item from the image data in accordance with a predetermined priority order of the characteristic detection item; A step of collating feature information of a format registered in advance; and a step of outputting the format when the detected feature information and the format of feature information extracted by the collation correspond one-to-one. An image data classification method, comprising:
【請求項2】 前記検出された特徴情報と前記照合によ
って抽出された特徴情報のフォーマットとが1対nで対
応する場合、 次の優先順となる特徴検出項目に対応した特徴情報の検
出およびその検出された特徴情報と先の照合で抽出され
たフォーマットの特徴情報との照合を、前記検出された
特徴情報とその照合によって抽出される特徴情報のフォ
ーマットとが1対1に対応するまで繰り返し行うことを
特徴とする請求項1記載の画像データ分類方法。
2. When the detected feature information and the format of the feature information extracted by the collation correspond one to n, detection of feature information corresponding to a feature detection item having the next priority order and its detection are performed. The matching between the detected feature information and the feature information of the format extracted by the previous matching is repeated until the detected feature information and the format of the feature information extracted by the matching correspond one-to-one. 2. The method according to claim 1, wherein:
【請求項3】 画像データを入力する工程と、 予め定められた特徴検出項目の優先順に従って前記画像
データの中からその特徴検出項目に対応した特徴情報を
検出し、その検出された特徴情報と予め登録されている
フォーマットの特徴情報とを照合する工程と、 前記照合により、前記検出された特徴情報が前記フォー
マットの特徴情報から抽出されなかった場合に、その検
出された特徴情報をそれに対応する特徴検出項目の新た
な特徴情報として登録する工程とを備えていることを特
徴とする画像データ登録方法。
3. A step of inputting image data, detecting feature information corresponding to the feature detection item from the image data in accordance with a predetermined priority order of the feature detection item, and detecting the detected feature information and A step of matching feature information of a format registered in advance, and if the detected feature information is not extracted from the feature information of the format by the matching, the detected feature information corresponds to the extracted feature information. Registering new feature information of the feature detection item as new feature information.
【請求項4】 前記照合により、前記検出された特徴情
報が前記フォーマットの特徴情報から抽出された場合、 次の優先順となる特徴検出項目に対応した特徴情報の検
出およびその検出した特徴情報と先の照合で抽出された
フォーマットの特徴情報との照合を、前記検出された特
徴情報がそのフォーマットの特徴情報から抽出されなく
なるまで繰り返して行うことを特徴とする請求項3記載
の画像データ登録方法。
4. When the detected feature information is extracted from the feature information of the format by the collation, detection of feature information corresponding to a feature detection item having the next priority order and detection of the detected feature information and 4. The image data registration method according to claim 3, wherein the matching with the feature information of the format extracted in the previous matching is repeatedly performed until the detected feature information is not extracted from the feature information of the format. .
JP09557598A 1998-04-08 1998-04-08 Form image classification method, form image registration method, and form image classification apparatus Expired - Fee Related JP3648050B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP09557598A JP3648050B2 (en) 1998-04-08 1998-04-08 Form image classification method, form image registration method, and form image classification apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP09557598A JP3648050B2 (en) 1998-04-08 1998-04-08 Form image classification method, form image registration method, and form image classification apparatus

Publications (2)

Publication Number Publication Date
JPH11296676A true JPH11296676A (en) 1999-10-29
JP3648050B2 JP3648050B2 (en) 2005-05-18

Family

ID=14141398

Family Applications (1)

Application Number Title Priority Date Filing Date
JP09557598A Expired - Fee Related JP3648050B2 (en) 1998-04-08 1998-04-08 Form image classification method, form image registration method, and form image classification apparatus

Country Status (1)

Country Link
JP (1) JP3648050B2 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007134920A (en) * 2005-11-10 2007-05-31 Casio Comput Co Ltd Image processing device, method, and program
JP2008310531A (en) * 2007-06-13 2008-12-25 Hitachi Computer Peripherals Co Ltd Business form identification method, business form identification program and optical character reading system using the business form identification method
JP2011118513A (en) * 2009-12-01 2011-06-16 Toshiba Corp Character recognition device and form identification method
JP2012009936A (en) * 2010-06-22 2012-01-12 Konica Minolta Business Technologies Inc Image forming multi-function apparatus
WO2019026147A1 (en) * 2017-07-31 2019-02-07 株式会社Pfu Information processing device, information processing system, control method, and control program
WO2020044537A1 (en) * 2018-08-31 2020-03-05 株式会社Pfu Image comparison device, image comparison method, and program

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007134920A (en) * 2005-11-10 2007-05-31 Casio Comput Co Ltd Image processing device, method, and program
JP4513726B2 (en) * 2005-11-10 2010-07-28 カシオ計算機株式会社 Image processing apparatus, image processing method, and image processing program
JP2008310531A (en) * 2007-06-13 2008-12-25 Hitachi Computer Peripherals Co Ltd Business form identification method, business form identification program and optical character reading system using the business form identification method
JP2011118513A (en) * 2009-12-01 2011-06-16 Toshiba Corp Character recognition device and form identification method
JP2012009936A (en) * 2010-06-22 2012-01-12 Konica Minolta Business Technologies Inc Image forming multi-function apparatus
WO2019026147A1 (en) * 2017-07-31 2019-02-07 株式会社Pfu Information processing device, information processing system, control method, and control program
WO2020044537A1 (en) * 2018-08-31 2020-03-05 株式会社Pfu Image comparison device, image comparison method, and program
JPWO2020044537A1 (en) * 2018-08-31 2021-03-18 株式会社Pfu Image matching device, image matching method, and program

Also Published As

Publication number Publication date
JP3648050B2 (en) 2005-05-18

Similar Documents

Publication Publication Date Title
JPH10501913A (en) System and method for automatic page registration and automatic area detection during form processing
CN106649420B (en) Image processing apparatus and image processing method
US9626738B2 (en) Image processing apparatus, image processing method, and storage medium
JPH11238097A (en) Mail address prereader and address prereading method
JP6786658B2 (en) Document reading system
JPH11296676A (en) Image data classification method and image data registration method
US20010043742A1 (en) Communication document detector
JP2003109007A (en) Device, method and program for classifying slip form and image collating device
CN101609453B (en) A kind of separator page and utilize the method and apparatus of document classification of this separator page
CN112541498A (en) Information processing apparatus and recording medium
JP6624120B2 (en) Character recognition device, character recognition method, character recognition program, and computer-readable recording medium storing character recognition program
JP5878004B2 (en) Multiple document recognition system and multiple document recognition method
US9152885B2 (en) Image processing apparatus that groups objects within image
JP2003316802A (en) Image management system, image management method and image management program
JPH11282956A (en) Slip identification method, its device and storage medium
JP2001101213A (en) Information processor, document managing device, information processing sysetm, information managing method and storage medium
JP5436040B2 (en) Image input / output device and monitoring system
JPH07152856A (en) Optical character reader
JP3959451B2 (en) Image reading system
US20230273952A1 (en) Image processing apparatus, image processing method, and storage medium
JP3065076U (en) Report management system
JPH1125214A (en) Device for identifying picture
JP2002007960A (en) Slip reading method and slip reading system
JP2000210624A (en) Mail address recognition device
JP4788205B2 (en) Document search apparatus and document search program

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20041012

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041026

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050208

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050210

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090218

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090218

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100218

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110218

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110218

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120218

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130218

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140218

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees