JP2002245403A - Device and program for identifying slip - Google Patents

Device and program for identifying slip

Info

Publication number
JP2002245403A
JP2002245403A JP2001044614A JP2001044614A JP2002245403A JP 2002245403 A JP2002245403 A JP 2002245403A JP 2001044614 A JP2001044614 A JP 2001044614A JP 2001044614 A JP2001044614 A JP 2001044614A JP 2002245403 A JP2002245403 A JP 2002245403A
Authority
JP
Japan
Prior art keywords
registered
corresponding point
dictionary
forms
difference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001044614A
Other languages
Japanese (ja)
Inventor
Goro Bessho
吾朗 別所
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2001044614A priority Critical patent/JP2002245403A/en
Publication of JP2002245403A publication Critical patent/JP2002245403A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

PROBLEM TO BE SOLVED: To identify even a slip having close resemblance to another with high accuracy. SOLUTION: A slip dictionary stores information about a correspondence point being a point representing a characteristic of a registered slip and a characteristic part as a characteristic different from the correspondence point. A correspondence point between a slip to be processed and the registered slip is detected (step S9). The degree of difference between the both slips is calculated (step S11) by referring to correspondence point information from the slip dictionary with respect to the correspondence point. When a plurality of registered slips, the magnitude of the degree of difference of which comes close to a prescribed extent do not exist (N of step S9), the type of the slip to be processed is identified according to the magnitude of the degree of difference (step S13), and when a plurality of the registered slips exist (Y of step S9), the type of the slip to be processed is identified by referring to the characteristics of registered slips whose correspondence points are different from the correspondence point from the slip dictionary (step S22 to S12).

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】この発明は、処理対象の帳票
が予め登録されている複数種類の帳票の中で何れの種類
に該当するかを識別する帳票識別装置及びプログラムに
関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a form identification apparatus and a program for identifying a form to be processed among a plurality of types of forms registered in advance.

【0002】[0002]

【従来の技術】従来、定型帳票の文字認識では、予め認
識すべき帳票上の位置と記入される文字種などの情報を
登録しておき、その文字領域を認識することが行われて
きた。しかし、1種類の帳票のみを扱うシステムでは問
題ないが、複数種類の帳票を同一システムにて処理する
場合、まず、処理対象の帳票が予め登録されている帳票
種の中のどのタイプのものかを判別する必要がある。そ
こで、処理対象の帳票と登録帳票との対応点を検出し、
対応点の情報より帳票間の類似度を求めて帳票の識別を
行う技術がある(特開平11−25215号公報参
照)。
2. Description of the Related Art Conventionally, in character recognition of a fixed form, information such as a position on a form to be recognized and a character type to be entered has been registered in advance, and a character area thereof has been recognized. However, although there is no problem in a system that handles only one type of form, when processing multiple types of forms in the same system, first, the type of form to be processed among the pre-registered form types Must be determined. Therefore, the corresponding point between the form to be processed and the registered form is detected,
There is a technique for determining a similarity between forms based on information on corresponding points to identify forms (see Japanese Patent Application Laid-Open No. H11-25215).

【0003】[0003]

【発明が解決しようとする課題】しかし、この技術で
は、登録されている帳票の形式において、帳票の一部の
文字が変化しているだけ、あるいは、文字や罫線の色が
違うというだけで、その他の部分は酷似しているという
場合では、類似度の算出のみでは誤りが発生するという
不具合があった。
However, in this technique, in the form of a registered form, only some characters of the form are changed, or only the colors of the characters and ruled lines are different. If the other parts are very similar, there is a problem that an error occurs only by calculating the similarity.

【0004】この発明の目的は、酷似している帳票に対
しても、精度良く帳票の識別を可能することである。
An object of the present invention is to enable a form to be identified with high accuracy even for forms that are very similar.

【0005】[0005]

【課題を解決するための手段】請求項1に記載の発明
は、処理対象の帳票が予め登録されている複数種類の帳
票の中で何れの種類に該当するかを識別する帳票識別装
置において、前記登録帳票の特徴を代表する点である対
応点の情報及び当該対応点とは異なる前記登録帳票の特
徴を記憶している帳票辞書と、前記処理対象帳票と前記
登録帳票との対応点を検出する対応点抽出手段と、この
対応点について前記帳票辞書より前記対応点の情報を参
照して前記両帳票間の相違度を算出する相違度算出手段
と、前記相違度の大きさが所定の程度に近接している前
記登録帳票が複数存在しないときには、前記相違度の大
きさにより前記処理対象帳票の種類を識別し、複数存在
したときには、前記帳票辞書より前記対応点とは異なる
前記登録帳票の特徴を参照して帳票の種類を識別する識
別手段と、を備えていることを特徴とする帳票識別装置
である。
According to a first aspect of the present invention, there is provided a form identification apparatus for identifying a type of a form to be processed among a plurality of types of forms registered in advance. A form dictionary storing information of corresponding points which are points representative of the characteristics of the registered form and characteristics of the registered form different from the corresponding points, and a corresponding point between the processing target form and the registered form are detected. Corresponding point extracting means, a dissimilarity calculating means for calculating the dissimilarity between the two forms with reference to the corresponding point information from the form dictionary for the corresponding points, When there are not a plurality of registered forms that are close to each other, the type of the processing target form is identified by the magnitude of the degree of difference, and when there are a plurality of registered forms, the registered form is different from the corresponding point from the form dictionary. Characteristic Identifying means for identifying the type of document with reference, it is document identification apparatus characterized in that it comprises.

【0006】したがって、酷似している帳票に対して
も、対応点とは異なる登録帳票の特徴を用いて、精度良
く帳票の識別を行うことができる。
[0006] Therefore, even for forms that are very similar, the forms can be identified with high accuracy by using the characteristics of the registered forms different from the corresponding points.

【0007】請求項2に記載の発明は、請求項1に記載
の帳票識別装置において、前記帳票辞書は前記対応点と
は異なる登録帳票の特徴として文字部分の情報を記憶し
ている。
According to a second aspect of the present invention, in the form identification apparatus according to the first aspect, the form dictionary stores information of a character portion as a feature of a registered form different from the corresponding point.

【0008】したがって、酷似している帳票に対して
も、文字部分の情報を用いて、精度良く帳票の識別を行
うことができる。
[0008] Therefore, it is possible to accurately identify a form that is very similar using information on the character portion.

【0009】請求項3に記載の発明は、請求項1又は2
に記載の帳票識別装置において、前記帳票辞書は前記対
応点とは異なる登録帳票の特徴として色情報を記憶して
いる。
The invention described in claim 3 is the first or second invention.
Wherein the form dictionary stores color information as a feature of a registered form different from the corresponding point.

【0010】したがって、酷似している帳票に対して
も、色情報を用いて、精度良く帳票の識別を行うことが
できる。
Therefore, it is possible to accurately identify a form that has a very similar form by using the color information.

【0011】請求項4に記載の発明は、処理対象の帳票
が予め登録されている複数種類の帳票の中で何れの種類
に該当するかを識別することをコンピュータに実行させ
るプログラムにおいて、前記処理対象帳票と前記登録帳
票との対応点を検出する対応点抽出処理と、前記登録帳
票の特徴を代表する点である対応点の情報及び当該対応
点とは異なる前記登録帳票の特徴を記憶している帳票辞
書より前記対応点の情報を参照して、前記対応点につい
て前記両帳票間の相違度を算出する相違度算出処理と、
前記相違度の大きさが所定の程度に近接している前記登
録帳票が複数存在しないときには、前記相違度の大きさ
により前記処理対象帳票の種類を識別し、複数存在した
ときには、前記帳票辞書より前記対応点とは異なる前記
登録帳票の特徴を参照して帳票の種類を識別する識別処
理と、をコンピュータに実行させるプログラムである。
According to a fourth aspect of the present invention, there is provided a program for causing a computer to identify a type of a form to be processed among a plurality of types of pre-registered forms. Corresponding point extraction processing for detecting a corresponding point between the target form and the registered form, storing information of the corresponding point which is a point representing the characteristic of the registered form and storing the characteristic of the registered form different from the corresponding point. By referring to the information of the corresponding points from the form dictionary, and calculating the difference between the two forms for the corresponding points,
When there is no plurality of registered forms in which the magnitude of the difference is close to a predetermined degree, the type of the processing target form is identified by the magnitude of the degree of difference. And identifying the type of the form by referring to the characteristics of the registered form different from the corresponding points.

【0012】したがって、酷似している帳票に対して
も、対応点とは異なる登録帳票の特徴を用いて、精度良
く帳票の識別を行うことができる。
[0012] Therefore, it is possible to accurately identify a form using a characteristic of a registered form different from a corresponding point even for a form that is very similar.

【0013】請求項5に記載の発明は、請求項4に記載
のプログラムにおいて、前記識別処理は前記帳票辞書に
前記対応点とは異なる登録帳票の特徴として記憶してい
る文字部分の情報を参照するものである。
According to a fifth aspect of the present invention, in the program according to the fourth aspect, the identification processing refers to information of a character portion stored in the form dictionary as a feature of a registered form different from the corresponding point. Is what you do.

【0014】したがって、酷似している帳票に対して
も、文字部分の情報を用いて、精度良く帳票の識別を行
うことができる。
[0014] Therefore, it is possible to accurately identify a form using information of a character portion even for a form that is very similar.

【0015】請求項6に記載の発明は、請求項4又は5
に記載のプログラムにおいて、前記識別処理は前記帳票
辞書に前記対応点とは異なる登録帳票の特徴として記憶
している色情報を参照するものである。
The invention according to claim 6 is the invention according to claim 4 or 5.
Wherein the identification processing refers to color information stored in the form dictionary as a feature of a registered form different from the corresponding point.

【0016】したがって、酷似している帳票に対して
も、色情報を用いて、精度良く帳票の識別を行うことが
できる。
[0016] Therefore, it is possible to accurately identify a form using color information even for a form that is very similar.

【0017】[0017]

【発明の実施の形態】この発明の一実施の形態について
説明する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS One embodiment of the present invention will be described.

【0018】図1は、この発明の一実施の形態である帳
票識別装置1の機能ブロック図であり,図2は、帳票識
別装置1が行う処理の流れを説明するフローチャートで
ある。
FIG. 1 is a functional block diagram of a form identification device 1 according to an embodiment of the present invention, and FIG. 2 is a flowchart for explaining the flow of processing performed by the form identification device 1.

【0019】図1,図2に示すように,帳票識別装置1
は、まず、スキャナ等の画像入力手段2によって、帳票
のマスター画像(データの書かれていない空の帳票)を
読み取り(ステップS1)、マスター画像メモリ3に記
憶する。このマスター画像をディスプレイなどに表示さ
せながら、文字認識の対象となる枠の位置や認識対象文
字種などの認識領域情報を認識領域情報入力手段4で入
力し(ステップS2)、その情報をファイル(帳票辞書
5)に格納しておく。すなわち、この帳票画像の中で、
帳票の特徴を代表する点として、図3(a)のc1〜c5の
ような位置を対応点として帳票辞書5に代表点登録手段
6により登録しておく(ステップS3)。なお、この対
応点は、帳票全体にまんべんなく取るようにすると位置
合わせや帳票識別の精度は高くなる。
As shown in FIGS. 1 and 2, the form identification device 1
First, a master image of a form (an empty form on which no data is written) is read by the image input means 2 such as a scanner (step S1) and stored in the master image memory 3. While displaying the master image on a display or the like, recognition area information such as the position of a frame to be subjected to character recognition and the type of character to be recognized is input by the recognition area information input means 4 (step S2), and the information is stored in a file (form). It is stored in the dictionary 5). That is, in this form image,
As points representing the characteristics of the form, positions such as c1 to c5 in FIG. 3A are registered as corresponding points in the form dictionary 5 by the representative point registration means 6 (step S3). If the corresponding points are taken evenly over the entire form, the accuracy of positioning and form identification is increased.

【0020】しかし、図3の(a)と(b)のように帳
票の構造が酷似していて、一部の文字情報のみしか違い
の無い場合には、固有文字情報入力手段7により、特徴
のある文字部分の位置と文字コード(固有文字情報)を
帳票辞書5に持たせる(ステップS)。図3の例では、
(a)の「請求書」と(b)「領収書」の文字が違うの
みで、その他の情報は、同一であるので、構造のみから
では帳票の識別を行うのが非常に困難であるため、それ
ぞれの異なる文字の情報を辞書に与える。帳票識別が必
要な場合は、複数の帳票を同一のシステムで処理する場
合なので、通常このような帳票辞書5も、複数用意する
ことになる。
However, as shown in FIGS. 3 (a) and 3 (b), when the forms have very similar structures and only part of the character information is different, the unique character information input means 7 provides The form dictionary 5 has the position of the character part with the character and the character code (specific character information) (step S). In the example of FIG.
(A) "Invoice" and (b) "receipt" are different only, and other information is the same. Therefore, it is very difficult to identify the form only from the structure. , And gives information of each different character to the dictionary. When the form identification is required, a plurality of forms are processed by the same system, so that a plurality of such form dictionaries 5 are usually prepared.

【0021】次に、データ画像(文字認識の対象となる
データの記入されている帳票)も画像入力手段2で同様
に読み取り(ステップS5)、データ画像メモリ8に記
憶する。そして、データ画像に対して、帳票辞書5に登
録されている対応点の相当する座標値周辺を対応点抽出
手段9により探索し(ステップS6)、対応点メモリ1
0に記憶する。ステップS6により対応店抽出処理を実
現している。
Next, a data image (a form in which data to be subjected to character recognition is written) is similarly read by the image input means 2 (step S5) and stored in the data image memory 8. Then, the corresponding point extracting means 9 searches the data image around the coordinate values corresponding to the corresponding points registered in the form dictionary 5 (step S6).
Store to 0. The corresponding store extraction processing is realized by step S6.

【0022】アフィン変換を例にとれば、対応点が6組
以上得られた場合には、一方の画像上の点を(x,
y)、他方の画像上の対応点を(X,Y)とおけば、次
式のアフィン変換の計数a〜fを求めることができる。
Taking an affine transformation as an example, if six or more sets of corresponding points are obtained, a point on one image is set to (x,
y), if the corresponding point on the other image is (X, Y), the affine transformation counts a to f in the following equation can be obtained.

【0023】[0023]

【数1】 (Equation 1)

【0024】これから、 ずれ:e+f 伸縮:|ad−bc| 回転:b+c に適当な重みを付けて和を取ることで、相違度算出手段
11により、相違度を定義して求め(ステップS7)、
その結果を相違度メモリ12に記憶する。そして、この
処理を登録されているマスター画像の数分行う(ステッ
プS8のY)。ステップS7により相違度算出処理を実
現している。
From this, deviation: e 2 + f 2 expansion / contraction: | ad−bc | rotation: b 2 + c 2 is given an appropriate weight and the sum is obtained. (Step S7)
The result is stored in the difference memory 12. This processing is performed for the number of registered master images (Y in step S8). Step S7 implements the difference calculation processing.

【0025】次に、ステップS9以下で、すべてのマス
ター画像の中で、最も相違度が小さいものを該当する帳
票種として求める。しかし、第1位の相違度と第2位の
相違度の差が予め設定されている程度に小さい場合は
(ステップS9のY)、類似帳票間で誤って判断する場
合があるので、文字列認識手段13により、予め定めた
領域に対して文字認識を行ない(ステップS10)、そ
の結果を認識結果メモリ14に記憶する。そして、文字
列照合手段15により、帳票辞書5に登録されている文
字列との照合を行う(ステップS11)。つぎに、帳票
識別手段16により、照合結果のパターンとの一致度が
大きい方を該当する帳票種として判断する(ステップS
12)。文字列認識手段13、文字列照合手段15及び
帳票識別手段16により識別手段を実現している。ステ
ップS9〜S12により識別処理を実現している。これ
によって、内容のほぼ等しい類似帳票の識別が可能とな
る。
Next, in step S9 and subsequent steps, the one having the smallest difference among all master images is determined as the corresponding form type. However, if the difference between the first-place difference and the second-place difference is small enough to be set in advance (Y in step S9), the similar form may be erroneously determined. Character recognition is performed on the predetermined area by the recognition means 13 (step S10), and the result is stored in the recognition result memory 14. Then, the character string collating unit 15 performs collation with a character string registered in the form dictionary 5 (step S11). Next, the form identification unit 16 determines that the degree of matching with the pattern of the matching result is higher as the corresponding form type (step S).
12). The character string recognizing means 13, the character string collating means 15, and the form identifying means 16 realize an identifying means. The identification processing is realized by steps S9 to S12. This makes it possible to identify similar forms having substantially the same contents.

【0026】ステップS9で、第1位の相違度と第2位
の相違度の差が大きい場合は(ステップS9のN)、相
違度算出手段11により、第1位の相違度の帳票を出力
する(ステップS13)。
In step S9, if the difference between the first-place difference and the second-place difference is large (N in step S9), the difference calculation means 11 outputs a report of the first-place difference. (Step S13).

【0027】図4,図5は、帳票識別装置1の他の構成
例を説明する機能ブロック図及びフローチャートであ
る。図1,図2を参照して前記した帳票識別装置1と共
通する構成及び処理内容については、図1,図2と同一
符号を用い、詳細な説明は省略する。
FIGS. 4 and 5 are a functional block diagram and a flowchart for explaining another example of the configuration of the form identification apparatus 1. 1 and 2 are denoted by the same reference numerals as those in FIGS. 1 and 2, and detailed description thereof is omitted.

【0028】すなわち、ステップS1で用いるスキャナ
にはカラースキャナを用い、白黒2値化された画像だけ
ではなく、カラー画像もステップS1で取得し、前記の
文字列に代えて色情報を用いことも可能である。例え
ば、固有文字情報入力手段7に代えてRGBヒストグラ
ム作成手段21を用意し、マスター画像に対して、RG
B値のそれぞれの濃度ヒストグラムなどを求めて(ステ
ップS21)、これらの色情報を帳票辞書5に保持して
おいて、ヒストグラムを特徴量とした差を相違度と見な
することが考えられる。
That is, a color scanner is used as the scanner used in step S1, and not only a monochrome image but also a color image is obtained in step S1, and color information may be used in place of the character string. It is possible. For example, an RGB histogram creating unit 21 is prepared in place of the unique character information input unit 7, and an RGB histogram is created for the master image.
It is conceivable that a density histogram or the like of each B value is obtained (step S21), these pieces of color information are stored in the form dictionary 5, and a difference using the histogram as a feature amount is regarded as a difference.

【0029】すなわち、第1位の相違度と第2位の相違
度が小さい場合には(ステップS9のY)、RGBヒス
トグラム作成手段21により、データ画像に対して、R
GB値のそれぞれの濃度ヒストグラムなどを求め(ステ
ップS22)、文字列認識手段13及び文字列照合手段
15に代えてヒストグラム比較手段23を用意して、こ
のヒストグラム比較手段23により、ヒストグラムの差
を計算して(ステップS23)、帳票識別手段16によ
り、差の1番小さい帳票を出力する(ステップS12)
ようにすることができる。ヒストグラムを特徴量とした
差を相違度と見なす方法が考えられる。これによって、
フォーマットがほぼ同一でも線や文字の色の差がある帳
票の識別が可能となる。ヒストグラム比較手段23及び
帳票識別手段16により識別手段を実現している。ステ
ップS9,S22,S23,S12及びS13により識
別処理を実現している。
That is, when the degree of difference between the first place and the second place is small (Y in step S 9), the RGB histogram creating means 21 uses the RGB histogram creating means 21 to add R to the data image.
A density histogram or the like of each of the GB values is obtained (step S22), and a histogram comparing unit 23 is prepared in place of the character string recognizing unit 13 and the character string comparing unit 15, and the histogram difference is calculated by the histogram comparing unit 23. Then (step S23), the form identification unit 16 outputs the form with the smallest difference (step S12).
You can do so. A method is considered in which the difference using the histogram as the feature amount is regarded as the degree of difference. by this,
Even if the formats are almost the same, it is possible to identify a form having a difference in color between lines and characters. An identification unit is realized by the histogram comparison unit 23 and the form identification unit 16. The identification process is realized by steps S9, S22, S23, S12 and S13.

【0030】次に、帳票識別装置1の具体的な構成例を
説明する。
Next, a specific configuration example of the form identification device 1 will be described.

【0031】図4は、帳票識別装置1の電気的な接続を
示すブロック図である。図4に示すように、帳票識別装
置1は、PCなどのコンピュータであり、各種演算を行
ない、帳票識別装置1の各部を集中的に制御するCPU
12と、BIOSなどを格納したROM13と、CPU
2の作業エリアとなり、前記各メモリ3,8,10,1
2,14,22としても機能するRAM14とが、バス
15で接続されている。
FIG. 4 is a block diagram showing the electrical connection of the form identification apparatus 1. As shown in FIG. 4, the form identification device 1 is a computer such as a PC, and performs various operations, and a CPU that centrally controls each unit of the form identification device 1.
12, a ROM 13 storing a BIOS and the like, and a CPU
2 work area, and the memories 3, 8, 10, 1
The RAM 14, which also functions as 2, 14, and 22, is connected by a bus 15.

【0032】バス15には、所定のインターフェイスを
介して、各種プログラムが格納され、また、帳票辞書5
も格納されるハードディスクなどの磁気記憶装置16
と、マウス、キーボード等により構成され、画像の選
択、画像の変形ならびに属性の変更のための入力等に利
用される入力装置17と、CRT,LCDなどの表示装
置18と、光ディスクなどの記憶媒体9を読み取る光デ
ィスク装置などの記憶媒体読取装置20と、インターネ
ット22などのネットワークと通信を行う通信制御装置
21とが接続されている。なお、記憶媒体19として
は、CD,DVDなどの光ディスク、光磁気ディスク、
フロッピー(登録商標)ディスクなどの各種メディアを
用いることができる。
Various programs are stored in the bus 15 via a predetermined interface.
Storage device 16 such as a hard disk in which
And an input device 17 composed of a mouse, a keyboard, and the like, and used for input for selecting an image, deforming the image, and changing an attribute, a display device 18 such as a CRT, an LCD, and a storage medium such as an optical disk. A storage medium reading device 20 such as an optical disk device that reads the data 9 and a communication control device 21 that communicates with a network such as the Internet 22 are connected. As the storage medium 19, optical disks such as CDs and DVDs, magneto-optical disks,
Various media such as a floppy (registered trademark) disk can be used.

【0033】磁気記憶装置16には、この発明のプログ
ラムを実現する帳票識別プログラムが記憶されている。
この帳票識別プログラムは、記憶媒体19から記憶媒体
読取装置20により読み取るか、あるいは、インターネ
ット22などからダウンロードするなどして、ハードデ
ィスクにインストールしたものである。このインストー
ルにより帳票識別装置1は動作可能な状態となり、CP
U112は、帳票識別プログラムに従って動作すること
により、前記各手段を実現し、前記各メモリや帳票辞書
5を管理することが可能となる。この帳票識別プログラ
ムは、CAD用ソフトなど特定のアプリケーションソフ
トの一部をなすものであってもよい。また、所定のOS
上で動作するものであってもよい。
A form identification program for realizing the program of the present invention is stored in the magnetic storage device 16.
This form identification program is installed on the hard disk by reading from the storage medium 19 by the storage medium reading device 20 or by downloading from the Internet 22 or the like. With this installation, the form identification device 1 becomes operable, and the CP
The U112 operates in accordance with the form identification program, thereby realizing the above-described units and managing the memories and the form dictionary 5. This form identification program may be a part of specific application software such as CAD software. Also, a predetermined OS
It may operate on the above.

【0034】[0034]

【発明の効果】請求項1に記載の発明は、酷似している
帳票に対しても、対応点とは異なる登録帳票の特徴を用
いて、精度良く帳票の識別を行うことができる。
According to the first aspect of the present invention, it is possible to accurately identify a form using a characteristic of a registered form different from a corresponding point even for a form that is very similar.

【0035】請求項2に記載の発明は、請求項1に記載
の帳票識別装置において、酷似している帳票に対して
も、文字部分の情報を用いて、精度良く帳票の識別を行
うことができる。
According to a second aspect of the present invention, in the form identification apparatus according to the first aspect, the form can be identified with high accuracy by using the information of the character portion even for a form that is very similar. it can.

【0036】請求項3に記載の発明は、請求項1又は2
に記載の帳票識別装置において、酷似している帳票に対
しても、色情報を用いて、精度良く帳票の識別を行うこ
とができる。
The third aspect of the present invention is the first or second aspect.
In the form identification device described in 1 above, the form can be identified with high accuracy using the color information even for a form that is very similar.

【0037】請求項4に記載の発明は、酷似している帳
票に対しても、対応点とは異なる登録帳票の特徴を用い
て、精度良く帳票の識別を行うことができる。
According to the fourth aspect of the present invention, it is possible to accurately identify a form using a characteristic of a registered form that is different from a corresponding point even for a form that is very similar.

【0038】請求項5に記載の発明は、請求項4に記載
のプログラムにおいて、酷似している帳票に対しても、
文字部分の情報を用いて、精度良く帳票の識別を行うこ
とができる。
According to a fifth aspect of the present invention, there is provided the program according to the fourth aspect, wherein even a form that is very similar to the program is used.
Using the information of the character portion, the form can be identified with high accuracy.

【0039】請求項6に記載の発明は、請求項4又は5
に記載のプログラムにおいて、酷似している帳票に対し
ても、色情報を用いて、精度良く帳票の識別を行うこと
ができる。
The invention described in claim 6 is the invention according to claim 4 or 5
In the program described in (1), even for forms that are very similar, it is possible to accurately identify the forms using the color information.

【図面の簡単な説明】[Brief description of the drawings]

【図1】この発明の一実施の形態である帳票識別装置の
機能ブロック図である。
FIG. 1 is a functional block diagram of a form identification device according to an embodiment of the present invention.

【図2】同フローチャートである。FIG. 2 is the same flowchart.

【図3】前記帳票識別装置が行う処理を説明する説明図
である。
FIG. 3 is an explanatory diagram illustrating a process performed by the form identification device.

【図4】前記帳票識別装置の別の例を示す機能ブロック
図である。
FIG. 4 is a functional block diagram showing another example of the form identification device.

【図5】同フローチャートである。FIG. 5 is the same flowchart.

【図6】前記帳票識別装置の電気的な接続を示すブロッ
ク図である。
FIG. 6 is a block diagram showing an electrical connection of the form identification device.

【符号の説明】[Explanation of symbols]

1 帳票識別装置 9 対応点抽出手段 11 相違度算出手段 13 識別手段 15 識別手段 16 識別手段 23 識別手段 REFERENCE SIGNS LIST 1 form identification device 9 corresponding point extraction means 11 difference calculation means 13 identification means 15 identification means 16 identification means 23 identification means

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 処理対象の帳票が予め登録されている複
数種類の帳票の中で何れの種類に該当するかを識別する
帳票識別装置において、 前記登録帳票の特徴を代表する点である対応点の情報及
び当該対応点とは異なる前記登録帳票の特徴を記憶して
いる帳票辞書と、 前記処理対象帳票と前記登録帳票との対応点を検出する
対応点抽出手段と、 この対応点について前記帳票辞書より前記対応点の情報
を参照して前記両帳票間の相違度を算出する相違度算出
手段と、 前記相違度の大きさが所定の程度に近接している前記登
録帳票が複数存在しないときには、前記相違度の大きさ
により前記処理対象帳票の種類を識別し、複数存在した
ときには、前記帳票辞書より前記対応点とは異なる前記
登録帳票の特徴を参照して帳票の種類を識別する識別手
段と、を備えていることを特徴とする帳票識別装置。
1. A form identification apparatus for identifying a type of a form to be processed among a plurality of types of forms registered in advance, a corresponding point being a point representing a characteristic of the registered form. A form dictionary storing information of the registered form different from the corresponding point, a corresponding point extracting means for detecting a corresponding point between the processing target form and the registered form, and a form for the corresponding point. A dissimilarity calculating means for calculating the dissimilarity between the two forms by referring to the information of the corresponding points from a dictionary; and when there are no plural registered forms in which the magnitude of the dissimilarity is close to a predetermined degree. The type of the form to be processed is identified based on the magnitude of the degree of difference, and when there are a plurality of forms, an identification method for identifying the type of the form by referring to the characteristic of the registered form different from the corresponding point from the form dictionary. Document identification device, characterized in that it comprises a and.
【請求項2】 前記帳票辞書は前記対応点とは異なる登
録帳票の特徴として文字部分の情報を記憶している請求
項1に記載の帳票識別装置。
2. The form identification apparatus according to claim 1, wherein the form dictionary stores information of a character portion as a feature of a registered form different from the corresponding point.
【請求項3】 前記帳票辞書は前記対応点とは異なる登
録帳票の特徴として色情報を記憶している請求項1又は
2に記載の帳票識別装置。
3. The form identification apparatus according to claim 1, wherein the form dictionary stores color information as a feature of the registered form different from the corresponding point.
【請求項4】 処理対象の帳票が予め登録されている複
数種類の帳票の中で何れの種類に該当するかを識別する
ことをコンピュータに実行させるプログラムにおいて、 前記処理対象帳票と前記登録帳票との対応点を検出する
対応点抽出処理と、 前記登録帳票の特徴を代表する点である対応点の情報及
び当該対応点とは異なる前記登録帳票の特徴を記憶して
いる帳票辞書より前記対応点の情報を参照して、前記対
応点について前記両帳票間の相違度を算出する相違度算
出処理と、 前記相違度の大きさが所定の程度に近接している前記登
録帳票が複数存在しないときには、前記相違度の大きさ
により前記処理対象帳票の種類を識別し、複数存在した
ときには、前記帳票辞書より前記対応点とは異なる前記
登録帳票の特徴を参照して帳票の種類を識別する識別処
理と、をコンピュータに実行させるプログラム。
4. A program for causing a computer to identify a type of a form to be processed among a plurality of types of forms registered in advance, wherein the form to be processed, the registered form, A corresponding point extraction process for detecting a corresponding point of the corresponding form; information of the corresponding point representing a characteristic of the registered form, and a corresponding dictionary based on a form dictionary storing characteristics of the registered form different from the corresponding point. A difference calculation process of calculating the difference between the two forms with respect to the corresponding point, and when there is not a plurality of registered forms in which the magnitude of the difference is close to a predetermined degree. The type of the form to be processed is identified based on the magnitude of the degree of difference, and when a plurality of forms exist, the type of the form is identified by referring to the characteristics of the registered form different from the corresponding points from the form dictionary. And a program for causing a computer to execute another identification process.
【請求項5】 前記識別処理は前記帳票辞書に前記対応
点とは異なる登録帳票の特徴として記憶している文字部
分の情報を参照するものである請求項4に記載のプログ
ラム。
5. The program according to claim 4, wherein the identification processing refers to information of a character portion stored in the form dictionary as a feature of a registered form different from the corresponding point.
【請求項6】 前記識別処理は前記帳票辞書に前記対応
点とは異なる登録帳票の特徴として記憶している色情報
を参照するものである請求項4又は5に記載のプログラ
ム。
6. The program according to claim 4, wherein the identification processing refers to color information stored in the form dictionary as a feature of a registered form different from the corresponding point.
JP2001044614A 2001-02-21 2001-02-21 Device and program for identifying slip Pending JP2002245403A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001044614A JP2002245403A (en) 2001-02-21 2001-02-21 Device and program for identifying slip

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001044614A JP2002245403A (en) 2001-02-21 2001-02-21 Device and program for identifying slip

Publications (1)

Publication Number Publication Date
JP2002245403A true JP2002245403A (en) 2002-08-30

Family

ID=18906577

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001044614A Pending JP2002245403A (en) 2001-02-21 2001-02-21 Device and program for identifying slip

Country Status (1)

Country Link
JP (1) JP2002245403A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106649420A (en) * 2015-11-02 2017-05-10 富士施乐株式会社 Image processing apparatus and image processing method

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106649420A (en) * 2015-11-02 2017-05-10 富士施乐株式会社 Image processing apparatus and image processing method
JP2017090974A (en) * 2015-11-02 2017-05-25 富士ゼロックス株式会社 Image processing device and program
CN106649420B (en) * 2015-11-02 2021-03-30 富士施乐株式会社 Image processing apparatus and image processing method

Similar Documents

Publication Publication Date Title
US6320983B1 (en) Method and apparatus for character recognition, and computer-readable recording medium with a program making a computer execute the method recorded therein
JP4461769B2 (en) Document retrieval / browsing technique and document retrieval / browsing device
JP4539756B2 (en) Image processing apparatus and image processing program
JPS61267177A (en) Retrieving system for document picture information
JP2000227941A (en) System and method for processing handwritten information
JP2004139484A (en) Form processing device, program for implementing it, and program for creating form format
JP2008537198A (en) Intelligent import of information from a foreign application user interface using artificial intelligence
JP4704601B2 (en) Character recognition method, program, and recording medium
CN114529933A (en) Contract data difference comparison method, device, equipment and medium
CN111079749A (en) End-to-end commodity price tag character recognition method and system with attitude correction function
JP4136282B2 (en) Image processing apparatus, image processing method, and storage medium
JP2002245403A (en) Device and program for identifying slip
JP4804433B2 (en) Image processing apparatus, image processing method, and image processing program
CN112287763A (en) Image processing method, apparatus, device and medium
JP2000003403A (en) Method for supporting slip input
JP3090070B2 (en) Form identification method and device
JP5051174B2 (en) Form dictionary generation device, form identification device, form dictionary generation method, and program
JP2022090469A (en) Format defining device, format defining method, and program
JP3946043B2 (en) Form identification device and identification method
CN111383193A (en) Image restoration method and device
EP0750270A2 (en) An apparatus for recognising characters and a method therefor
JP2000090117A (en) Method and device for extracting logical element of document image, and recording medium therefor
CN114120016B (en) Character string extraction method, device, equipment and storage medium
JP2004259076A (en) Picture recognizing method and device
JP2932667B2 (en) Information retrieval method and information storage device

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20040930