JP2002358521A - Device, method and program for registering and identifying document format - Google Patents

Device, method and program for registering and identifying document format

Info

Publication number
JP2002358521A
JP2002358521A JP2001163783A JP2001163783A JP2002358521A JP 2002358521 A JP2002358521 A JP 2002358521A JP 2001163783 A JP2001163783 A JP 2001163783A JP 2001163783 A JP2001163783 A JP 2001163783A JP 2002358521 A JP2002358521 A JP 2002358521A
Authority
JP
Japan
Prior art keywords
information
ruled line
format
line pattern
filtering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001163783A
Other languages
Japanese (ja)
Inventor
Takayuki Kato
貴之 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2001163783A priority Critical patent/JP2002358521A/en
Publication of JP2002358521A publication Critical patent/JP2002358521A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

PROBLEM TO BE SOLVED: To identify a document feature while covering the existence of not only a ruled line but also a barcode, etc. SOLUTION: A slip format is registered by performing filtering for weakening the feature in the prescribed part of inputted document information (1), extracting the feature values of a ruled line pattern from filtered document information (2) and registering the extracted featured values of the ruled line s format information of the document. The document format is identified by performing filtering for weakening the feature in the prescribed part of the inputted document information (1), extracting the featured values of the input ruled line pattern from filtered input document information (2) and comparing the featured values of the input ruled line pattern with the pre-registered format information featured values so as to decide the format of the input ruled line pattern (3).

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、帳票フォーマット
登録・識別装置、方法及びプログラム、に関する。
[0001] The present invention relates to a form format registration / identification apparatus, method and program.

【0002】[0002]

【従来の技術】請求書、納品書等、商取引や事務処理で
用いる帳票には、書式の定まったものが多い。かかる定
型書式の帳票に所定事項をプリンタ等により印字する場
合等において、当該帳票に記載された罫線等の特徴か
ら、当該帳票の帳票種類を識別することができれば、所
定事項を印字する箇所を自動的に設定でき、事務処理の
効率化が図られるなどの点で、便宜である。
2. Description of the Related Art Many forms, such as bills and invoices, used in business transactions and business processes have a fixed format. For example, when a predetermined item is printed on a form of such a fixed form by a printer or the like, if the form type of the form can be identified based on features such as ruled lines described in the form, a place where the predetermined item is printed is automatically determined. This is convenient in that it can be set up efficiently and the efficiency of office work can be increased.

【0003】また、近年、所定事項についての情報をバ
ーコード化し、これを帳票に貼付又は直接印刷する場合
が多い。このような場合、複数の帳票間において、罫線
自体は全く同じであっても、バーコードの貼付等された
ものと貼付等されていないものとでは、その後の取扱い
が異なる場合が多いので、バーコードの有無によって区
別して扱うことが望ましい。例えば、バーコードを有す
る帳票をこれを有しない帳票と区別した後、バーコード
を有する帳票についてのみ、その後の作業として、バー
コードに記載された情報の読み取りを行う場合などに
は、バーコードの有無により、区別して扱うことが必要
である。
In recent years, in many cases, information on a predetermined item is converted into a barcode, which is pasted on a form or directly printed. In such a case, even if the ruled line itself is exactly the same between a plurality of forms, the subsequent handling is often different between the one with the bar code attached and the one without the bar code attached. It is desirable to treat it differently depending on the presence or absence of the code. For example, after distinguishing a form having a barcode from a form having no barcode, when reading information described in the barcode as a subsequent operation only for a form having a barcode, the barcode It is necessary to treat it differently depending on the presence or absence.

【0004】ところで、かかる帳票種類の識別は、次の
ような手順によりになされる。即ち、予め複数の帳票フ
ォーマットを登録しておく(以下、この手続を「帳票フ
ォーマット登録」という)。そして、帳票を読み取り、
当該帳票の罫線パターンを抽出し、抽出した罫線パター
ンを、前記複数の登録帳票フォーマットのそれぞれと比
較してその類似度を算出し、最も類似度の高い登録帳票
フォーマットであって所定しきい値を超えるものが、読
み取られた帳票の帳票フォーマットと判定される(以
下、この手続を「帳票フォーマット識別」という)。図
2は、かかる帳票種類を識別する装置の従来例の構成を
示す、機能ブロック図である。
[0004] The identification of the form type is performed according to the following procedure. That is, a plurality of form formats are registered in advance (hereinafter, this procedure is referred to as “form form registration”). And read the form,
The ruled line pattern of the form is extracted, and the extracted ruled line pattern is compared with each of the plurality of registered form formats to calculate the degree of similarity. Anything exceeding that is determined as the form format of the read form (hereinafter, this procedure is referred to as “form format identification”). FIG. 2 is a functional block diagram showing the configuration of a conventional example of such a device for identifying a form type.

【0005】従来の帳票自動識別装置3における帳票フ
ォーマット登録は次のようになされる。即ち、帳票情報
入力部31により帳票情報が読み取られ、読み取られた
帳票情報が、罫線パターン抽出部33に与えられる。罫
線パターン抽出部33において、帳票情報から罫線パタ
ーンが抽出され、抽出された罫線パターンは、フォーマ
ット登録部34により帳票フォーマットとして登録され
る。
[0005] The form format registration in the conventional form automatic identification device 3 is performed as follows. That is, the form information is read by the form information input unit 31, and the read form information is given to the ruled line pattern extracting unit 33. In the ruled line pattern extraction unit 33, a ruled line pattern is extracted from the form information, and the extracted ruled line pattern is registered as a form format by the format registration unit.

【0006】これに対して、従来の帳票フォーマット登
録・識別装置3における帳票フォーマット識別は、次の
ようになされる。即ち、フォーマット登録の場合と同
様、帳票情報入力部31により帳票情報が読み取られ、
読み取られた帳票情報が、罫線パターン抽出部33に与
えられる。罫線パターン抽出部33において、帳票情報
から入力罫線パターンが抽出され、識別部36に与えら
れる。
On the other hand, the form format identification in the conventional form format registration / identification device 3 is performed as follows. That is, similar to the format registration, the form information is read by the form information input unit 31,
The read form information is provided to the ruled line pattern extraction unit 33. In the ruled line pattern extraction unit 33, an input ruled line pattern is extracted from the form information, and given to the identification unit.

【0007】一方、フォーマット読取部34によって、
登録された帳票フォーマットが1つずつ読み出されて
は、識別部36に送られる。識別部36においては、入
力罫線パターンと、複数の登録フォーマットとが1つず
つ比較に供され、入力罫線パターンと、各登録フォーマ
ットとの類似度が算出さる。入力罫線パターンと最も類
似度の高い登録帳票フォーマットであって所定しきい値
を超えるものが、入力罫線パターンの帳票フォーマット
として決定される。そして、決定された帳票フォーマッ
トが、図示しない表示部に表示され、ユーザの確認等に
供される。
On the other hand, the format reading unit 34
The registered form formats are read out one by one and sent to the identification unit 36. In the identification unit 36, the input ruled line pattern and the plurality of registered formats are subjected to comparison one by one, and the similarity between the input ruled line pattern and each registered format is calculated. The registered form format having the highest similarity to the input ruled line pattern and exceeding the predetermined threshold value is determined as the form format of the input ruled line pattern. Then, the determined form format is displayed on a display unit (not shown) and used for user confirmation and the like.

【0008】しかしながら、かかる従来装置において
は、帳票内に、罫線以外の付記事項、例えば、バーコー
ド、文字、記号等(以下、「バーコード等」ともいう)
が記載されている場合には、かかるバーコード等が、罫
線の一部として認識されるため、罫線自体は全く同じで
あるにも拘わらず、全く異なる罫線パターンとして認識
される。例えば、図3(A)〜3(C)に記載の帳票
は、罫線自体は全く同じであるにもかかわらず、従来装
置においては、すべて異なる罫線パターンとして認識さ
れる。これは、図3(B)と図3(C)には、左下にバ
ーコードが記されており、また、図3(B)と図3
(C)とでは、バーコードの模様が異なる。一方、罫線
パターンの判定は、罫線にバーコードの模様を含めた帳
票全体の観察によりなされるため、図3(A)から図3
(C)は全て異なる罫線パターンとして認識されるため
である。
However, in such a conventional apparatus, additional items other than ruled lines, for example, bar codes, characters, symbols, etc. (hereinafter, also referred to as “bar codes, etc.”) are included in the form.
Is described, such a barcode or the like is recognized as a part of the ruled line. Therefore, although the ruled line itself is completely the same, it is recognized as a completely different ruled line pattern. For example, the forms described in FIGS. 3A to 3C are all recognized as different ruled line patterns in the conventional device, although the ruled lines themselves are exactly the same. This is because a bar code is written at the lower left in FIGS. 3B and 3C, and FIG. 3B and FIG.
(C) is different from the barcode pattern. On the other hand, since the determination of the ruled line pattern is made by observing the entire form including the barcode pattern in the ruled line, FIG.
This is because (C) is all recognized as different ruled line patterns.

【0009】かかる問題を解決すべく、他の従来装置に
おいては、バーコード等にマスク処理を施すことによ
り、バーコード等が記されていないものとして扱う技術
が採用されている。この技術によれば、図3(B)及び
(C)のバーコードが記載された帳票は、マスク処理に
よりバーコード等が付されていなものと同じに扱われ、
その結果、図3(A)〜3(C)は、全て同じ種類の罫
線パターンとして認識されることとなる。
In order to solve such a problem, another conventional apparatus employs a technique in which a bar code or the like is subjected to a masking process so as to treat the bar code or the like as not having a bar code or the like. According to this technique, the form on which the barcode shown in FIGS. 3B and 3C is described is handled in the same manner as a form without a barcode or the like by the mask processing.
As a result, FIGS. 3A to 3C are all recognized as ruled line patterns of the same type.

【0010】[0010]

【発明が解決しようとする課題】しかしながら、かかる
マスク処理を施す装置では、バーコード等の有無は全く
無視される。このため、バーコード等の有無により帳票
を区別したうえで、その後さらにバーコード等を有する
帳票について、バーコード等の情報を読み取るといっ
た、その後の処理を行うことができない、という不具合
がある。
However, in an apparatus for performing such a mask process, the presence or absence of a bar code or the like is completely ignored. For this reason, there is a problem in that it is not possible to perform subsequent processing, such as reading information such as a barcode on a form having a barcode or the like after distinguishing the form based on the presence or absence of a barcode or the like.

【0011】そこで、本発明は、罫線のみならず、バー
コード等の有無をも含めて帳票特徴を識別することがで
きる、帳票フォーマット登録・識別装置を提供すること
を目的とする。
SUMMARY OF THE INVENTION It is an object of the present invention to provide a form format registration / identification apparatus capable of identifying form characteristics including not only ruled lines but also the presence or absence of a barcode or the like.

【0012】[0012]

【課題を解決するための手段】(A)第1の発明は、
(1)入力された帳票情報の所定部分に、特徴を弱める
フィルタリングを実行する手段と、(2)前記フィルタ
リングを実行した帳票情報から罫線パターンの特徴量を
抽出する手段と、(3)抽出された罫線パターンの特徴
量を当該帳票のフォーマット情報として登録する手段と
を備えたことを特徴とする帳票フォーマット登録・識別
装置を提供する。
Means for Solving the Problems (A) The first invention provides
(1) means for performing filtering for weakening a feature on a predetermined portion of the input form information; (2) means for extracting a feature amount of a ruled line pattern from the filtered form information; Means for registering the characteristic amount of the ruled line pattern as format information of the form.

【0013】かくして、バーコード等の有無を反映した
罫線パターンを登録することができるため、帳票の罫線
パターンの識別後に、バーコードの読み取り等の更に進
んだ処理を行うことが可能となる。
Thus, since a ruled line pattern reflecting the presence or absence of a barcode or the like can be registered, further processing such as reading a barcode can be performed after the ruled line pattern of the form is identified.

【0014】(B)第2の発明は、(1)入力された帳
票情報の所定部分に、特徴を弱めるフィルタリングを実
行する手段と、(2)前記フィルタリングを行った入力
帳票情報から入力罫線パターンの特徴量を抽出する手段
と、(3)入力罫線パターンの特徴量を、予め登録され
ているフォーマット情報の特徴量と比較することによ
り、入力罫線パターンのフォーマットを決定する手段と
を備えたことを特徴とする帳票フォーマット登録・識別
装置を提供する。
(B) The second invention provides (1) means for performing filtering for weakening a feature on a predetermined portion of the input form information, and (2) an input ruled line pattern from the input form information on which the filtering has been performed. And (3) means for determining the format of the input ruled line pattern by comparing the featured value of the input ruled line pattern with the characteristic amount of the format information registered in advance. The present invention provides a form format registration / identification device characterized by the following.

【0015】かくして、バーコード等の有無を反映した
罫線パターンを識別することができるため、帳票の罫線
パターンの識別後に、バーコードの読み取り等の更に進
んだ処理を行うことが可能となる。
In this way, since a ruled line pattern reflecting the presence or absence of a barcode or the like can be identified, it is possible to perform further processing such as reading a barcode after identifying the ruled line pattern of a form.

【0016】(C)第3の発明は、(1)入力された帳
票情報から入力罫線パターンの特徴量を抽出する手段
と、(2)特徴を弱めるフィルタリングを実行するため
のフィルタリング情報を生成する手段と、(3)抽出し
た罫線パターンの特徴量に、生成したフィルタリング情
報を付加してフォーマット情報として登録する手段とを
備えたことを特徴とする帳票フォーマット登録・識別装
置を提供する。
(C) The third invention provides (1) means for extracting a feature amount of an input ruled line pattern from input form information, and (2) filtering information for executing filtering for weakening features. A form format registration / identification apparatus characterized by comprising means and (3) means for adding generated filtering information to the extracted feature amount of a ruled line pattern and registering the information as format information.

【0017】かくして、フォーマット登録時には、罫線
パターンにフィルタリング情報を付加して登録するた
め、登録フォーマット数が少なくて済む。
Thus, at the time of format registration, filtering information is added to the ruled line pattern and registered, so that the number of registered formats can be reduced.

【0018】(D)第4の発明は、(1)入力された帳
票情報から入力罫線パターンの特徴量を抽出する手段
と、(2)1以上の登録フォーマット情報を、これに付
加されたフィルタリング情報とともに順次読み出す手段
と、(3)抽出された入力罫線パターンの特徴量と読み
出された登録フォーマット情報の特徴量の双方に、読み
出されたフィルタリング情報に基づく同一のフィルタリ
ングを実行する手段と、(4)フィルタリング実行後の
入力罫線パターンの特徴量と登録フォーマット情報の特
徴量とを比較することにより、入力罫線パターンのフォ
ーマットを決定する手段とを備えたことを特徴とする帳
票フォーマット登録・識別装置を提供する。
(D) The fourth invention provides (1) means for extracting a feature amount of an input ruled line pattern from input form information, and (2) filtering of one or more registered format information added thereto. Means for sequentially reading the information together with the information; and (3) means for executing the same filtering based on the read filtering information on both the extracted feature of the input ruled line pattern and the read feature of the registered format information. (4) means for determining the format of the input ruled line pattern by comparing the characteristic amount of the input ruled line pattern after filtering is executed with the characteristic amount of the registered format information; An identification device is provided.

【0019】かくして、フィルタリングを罫線パターン
の識別時に行うこととしているため、少ない登録フォー
マット数で多種類の罫線パターンに対応することができ
る。
Since filtering is performed at the time of identifying a ruled line pattern, a large number of ruled line patterns can be handled with a small number of registered formats.

【0020】(E)第5の発明は、第1〜4の発明にお
いて、前記フィルタリングは、ぼかし処理、モザイク処
理及び強調処理のうちのいずれか又はこれらの組合せで
あることを特徴とする帳票フォーマット登録・識別装置
を提供する。
(E) In a fifth aspect based on the first to fourth aspects, the filtering is any one of a blurring process, a mosaic process, and an emphasis process, or a combination thereof. Provide a registration and identification device.

【0021】かくして、種々のフィルタリングを採用で
きるため、フィルタリング対象に最もふさわしいフィル
タリング種類を選択することができる。
Thus, since various types of filtering can be employed, the type of filtering most suitable for the filtering target can be selected.

【0022】(F)第6の発明は、(1)入力された帳
票情報の所定部分に、特徴を弱めるフィルタリングを実
行し、(2)前記フィルタリングを実行した帳票情報か
ら罫線パターンの特徴量を抽出し、(3)抽出された罫
線パターンの特徴量を当該帳票のフォーマット情報とし
て登録する、ことを特徴とする帳票フォーマット登録・
識別方法を提供する。
(F) A sixth aspect of the present invention is to (1) perform filtering for weakening a feature on a predetermined portion of the input form information, and (2) extract a characteristic amount of a ruled line pattern from the filtered form information. (3) registering a feature amount of the extracted ruled line pattern as format information of the form;
Provide an identification method.

【0023】かくして、バーコード等の有無を反映した
罫線パターンを登録することができるため、帳票の罫線
パターンの識別後に、バーコードの読み取り等の更に進
んだ処理を行うことが可能となる。
Thus, since a ruled line pattern reflecting the presence / absence of a barcode or the like can be registered, it is possible to perform further processing such as reading a barcode after identifying the ruled line pattern of a form.

【0024】(G)第7の発明は、(1)入力された帳
票情報の所定部分に、特徴を弱めるフィルタリングを実
行し、(2)前記フィルタリングを行った入力帳票情報
から入力罫線パターンの特徴量を抽出し、(3)入力罫
線パターンの特徴量を、予め登録されているフォーマッ
ト情報の特徴量と比較することにより、入力罫線パター
ンのフォーマットを決定することを特徴とする帳票フォ
ーマット登録・識別方法を提供する。
(G) According to a seventh aspect of the present invention, (1) filtering for weakening a feature is performed on a predetermined portion of the input form information, and (2) characteristics of an input ruled line pattern based on the filtered input form information. (3) Form format registration / identification wherein the format of the input ruled line pattern is determined by comparing the feature amount of the input ruled line pattern with the feature amount of the format information registered in advance. Provide a way.

【0025】かくして、バーコード等の有無を反映した
罫線パターンを識別することができるため、帳票の罫線
パターンの識別後に、バーコードの読み取り等の更に進
んだ処理を行うことが可能となる。
Thus, since a ruled line pattern reflecting the presence / absence of a barcode or the like can be identified, it is possible to perform further processing such as reading a barcode after identifying the ruled line pattern of a form.

【0026】(H)第8発明は、(1)入力された帳票
情報から入力罫線パターンの特徴量を抽出し、(2)特
徴を弱めるフィルタリングを実行するためのフィルタリ
ング情報を生成し、(3)抽出した罫線パターンの特徴
量に、生成したフィルタリング情報を付加してフォーマ
ット情報として登録することを特徴とする帳票フォーマ
ット登録・識別方法を提供する。
(H) According to an eighth aspect of the present invention, (1) extracting a feature amount of an input ruled line pattern from input form information, (2) generating filtering information for executing filtering for weakening a feature, and (3) A) providing a form format registration / identification method characterized in that generated filtering information is added to the extracted feature amount of a ruled line pattern and registered as format information;

【0027】かくして、フォーマット登録時には、罫線
パターンにフィルタリング情報を付加して登録するた
め、登録フォーマット数が少なくて済む。
Thus, at the time of format registration, filtering information is added to the ruled line pattern and registered, so that the number of registered formats can be reduced.

【0028】(I)第9の発明は、(1)入力された帳
票情報から入力罫線パターンの特徴量を抽出し、(2)
1以上の登録フォーマット情報を、これに付加されたフ
ィルタリング情報とともに順次読み出し、(3)抽出さ
れた入力罫線パターンの特徴量と読み出された登録フォ
ーマット情報の特徴量の双方に、読み出されたフィルタ
リング情報に基づく同一のフィルタリングを実行し、
(4)フィルタリング実行後の入力罫線パターンの特徴
量と登録フォーマット情報の特徴量とを比較することに
より、入力罫線パターンのフォーマットを決定すること
を特徴とする帳票フォーマット登録・識別方法を提供す
る。
(I) The ninth invention provides (1) extracting a feature amount of an input ruled line pattern from input form information, and (2)
One or more registered format information is sequentially read out together with the filtering information added thereto, and (3) both the extracted feature amount of the input ruled line pattern and the feature amount of the read-out registered format information are read out. Perform the same filtering based on the filtering information,
(4) A form format registration / identification method characterized by determining the format of an input ruled line pattern by comparing the characteristic amount of an input ruled line pattern after filtering and the characteristic amount of registered format information.

【0029】かくして、フィルタリングを罫線パターン
の識別時に行うこととしているため、少ない登録フォー
マット数で多種類の罫線パターンに対応することができ
る。
Since filtering is performed at the time of identifying a ruled line pattern, a large number of types of ruled line patterns can be handled with a small number of registered formats.

【0030】(J)第10の発明は、第6〜9の発明に
おいて、前記フィルタリングは、ぼかし処理、モザイク
処理及び強調処理のうちのいずれか又はこれらの組合せ
であることを特徴とする帳票フォーマット登録・識別方
法を提供する。
(J) The tenth invention is based on the sixth to ninth inventions, wherein the filtering is any one of blur processing, mosaic processing and enhancement processing or a combination thereof. Provides registration and identification methods.

【0031】かくして、種々のフィルタリングを採用で
きるため、フィルタリング対象に最もふさわしいフィル
タリング種類を選択することができる。
Thus, since various types of filtering can be adopted, the type of filtering most suitable for the filtering target can be selected.

【0032】(K)第11の発明は、(1)入力された
帳票情報の所定部分に、特徴を弱めるフィルタリングを
実行し、(2)前記フィルタリングを実行した帳票情報
から罫線パターンの特徴量を抽出し、(3)抽出された
罫線パターンの特徴量を当該帳票のフォーマット情報と
して登録することを特徴とする帳票フォーマット登録・
識別プログラムを提供する。
(K) In the eleventh invention, (1) filtering for weakening a feature is performed on a predetermined portion of the input form information, and (2) the feature amount of the ruled line pattern is calculated from the filtered form information. (3) Form format registration and registration, characterized in that the feature amount of the extracted ruled line pattern is registered as format information of the form.
Provide an identification program.

【0033】かくして、バーコード等の有無を反映した
罫線パターンを登録することができるため、帳票の罫線
パターンの識別後に、バーコードの読み取り等の更に進
んだ処理を行うことが可能となる。
Thus, since a ruled line pattern reflecting the presence or absence of a barcode or the like can be registered, further processing such as reading a barcode can be performed after the ruled line pattern of the form is identified.

【0034】(L)第12の発明は、(1)入力された
帳票情報の所定部分に、特徴を弱めるフィルタリングを
実行し、(2)前記フィルタリングを行った入力帳票情
報から入力罫線パターンの特徴量を抽出し、(3)入力
罫線パターンの特徴量を、予め登録されているフォーマ
ット情報の特徴量と比較することにより、入力罫線パタ
ーンのフォーマットを決定することを特徴とする帳票フ
ォーマット登録・識別プログラムを提供する。
(L) The twelfth invention provides (1) filtering for weakening a feature in a predetermined portion of the input form information, and (2) characteristics of an input ruled line pattern from the filtered input form information. (3) Form format registration / identification wherein the format of the input ruled line pattern is determined by comparing the feature amount of the input ruled line pattern with the feature amount of the format information registered in advance. Provide a program.

【0035】かくして、バーコード等の有無を反映した
罫線パターンを識別することができるため、帳票の罫線
パターンの識別後に、バーコードの読み取り等の更に進
んだ処理を行うことが可能となる。
In this way, since a ruled line pattern reflecting the presence or absence of a barcode or the like can be identified, it is possible to perform further processing such as reading a barcode after identifying the ruled line pattern of a form.

【0036】(M)第13の発明は、(1)入力された
帳票情報から入力罫線パターンの特徴量を抽出し、
(2)特徴を弱めるフィルタリングを実行するためのフ
ィルタリング情報を生成し、(3)抽出した罫線パター
ンの特徴量に、生成したフィルタリング情報を付加して
フォーマット情報として登録することを特徴とする帳票
フォーマット登録・識別プログラムを提供する。
(M) According to a thirteenth aspect, (1) a feature amount of an input ruled line pattern is extracted from input form information,
(2) A form format characterized by generating filtering information for executing filtering for weakening the feature, and (3) adding the generated filtering information to the extracted feature amount of the ruled line pattern and registering the information as format information. Provide a registration and identification program.

【0037】かくして、フォーマット登録時には、罫線
パターンにフィルタリング情報を付加して登録するた
め、登録フォーマット数が少なくて済む。
Thus, at the time of format registration, filtering information is added to the ruled line pattern and registered, so that the number of registered formats can be reduced.

【0038】(N)第14の発明は、(1)入力された
帳票情報から入力罫線パターンの特徴量を抽出し、
(2)1以上の登録フォーマット情報を、これに付加さ
れたフィルタリング情報とともに順次読み出し、(3)
抽出された入力罫線パターンの特徴量と読み出された登
録フォーマット情報の特徴量の双方に、読み出されたフ
ィルタリング情報に基づく同一のフィルタリングを実行
し、(4)フィルタリング実行後の入力罫線パターンの
特徴量と登録フォーマット情報の特徴量とを比較するこ
とにより、入力罫線パターンのフォーマットを決定する
ことを特徴とする帳票フォーマット登録・識別プログラ
ムを提供する。
(N) A fourteenth aspect of the present invention is to (1) extract a feature amount of an input ruled line pattern from input form information;
(2) One or more registered format information is sequentially read out together with the filtering information added thereto, and (3)
The same filtering based on the read filtering information is performed on both the extracted feature amount of the input ruled line pattern and the feature amount of the read registered format information, and (4) the input ruled line pattern after the filtering is executed. A form format registration / identification program characterized in that a format of an input ruled line pattern is determined by comparing a feature value with a feature value of registered format information.

【0039】かくして、フィルタリングを罫線パターン
の識別時に行うこととしているため、少ない登録フォー
マット数で多種類の罫線パターンに対応することができ
る。
Thus, since filtering is performed at the time of identifying a ruled line pattern, it is possible to handle a large number of ruled line patterns with a small number of registered formats.

【0040】(O)第15の発明は、第11〜14の発
明において、前記フィルタリングは、ぼかし処理、モザ
イク処理及び強調処理のうちのいずれか又はこれらの組
合せであることを特徴とする帳票フォーマット登録・識
別プログラムを提供する。
(O) A fifteenth invention according to the eleventh to fourteenth inventions, wherein the filtering is any one of a blur processing, a mosaic processing and an emphasis processing or a combination thereof. Provide a registration and identification program.

【0041】かくして、種々のフィルタリングを採用で
きるため、フィルタリング対象に最もふさわしいフィル
タリング種類を選択することができる。
As described above, since various types of filtering can be adopted, it is possible to select the type of filtering most suitable for the filtering target.

【0042】[0042]

【発明の実施の形態】以下、本発明の実施形態を図面を
参照しながら詳細に説明する。
Embodiments of the present invention will be described below in detail with reference to the drawings.

【0043】(A)第1実施形態 図1及び図4〜6を参照しながら、本発明の第1実施形
態に係る帳票フォーマット登録・識別装置について説明
する。
(A) First Embodiment A form format registration / identification apparatus according to a first embodiment of the present invention will be described with reference to FIG. 1 and FIGS.

【0044】(A−1)第1実施形態の構成 第1実施形態に係る帳票フォーマット登録・識別装置の
構成を、図1を用いて説明する。図1は、かかる構成の
機能ブロック図である。
(A-1) Configuration of First Embodiment The configuration of a form format registration / identification device according to the first embodiment will be described with reference to FIG. FIG. 1 is a functional block diagram of such a configuration.

【0045】第1実施形態の帳票フォーマット登録・識
別装置1は、帳票情報入力部11、フィルタリング実行
部12、罫線パターン抽出部13、フォーマット登録部
14、フォーマット読取部15、及び識別部16から構
成される。
The form format registration / identification device 1 of the first embodiment comprises a form information input unit 11, a filtering execution unit 12, a ruled line pattern extraction unit 13, a format registration unit 14, a format reading unit 15, and an identification unit 16. Is done.

【0046】ここで、帳票情報入力部11は、帳票に記
載された情報(帳票に記載された全ての情報をいい、具
体的には、罫線、線図、文字、記号等をいう。以下、
「帳票情報」ともいう)を読み取り、読み取った帳票情
報を、フィルタリング実行部12の与えるものである。
Here, the form information input section 11 is used for information described on the form (refers to all information described on the form, specifically, ruled lines, diagrams, characters, symbols, etc.).
This is also what the filtering execution unit 12 gives the read form information.

【0047】フィルタリング実行部12は、与えられた
帳票情報内の所定部分に、当該部分内の特徴を弱める働
きをするフィルタリング(filtering)を実行するもの
である。
The filtering execution section 12 executes filtering on a predetermined portion in the given form information, which acts to weaken the features in the portion.

【0048】罫線パターン抽出部13は、フィルタリン
グ実行後の帳票情報から、罫線パターンの特徴量を抽出
し、抽出した罫線パターンの特徴量をフォーマット登録
部14及び識別部16に与えるものである。
The ruled line pattern extracting unit 13 extracts the characteristic amount of the ruled line pattern from the form information after the execution of the filtering, and provides the extracted characteristic amount of the ruled line pattern to the format registration unit 14 and the identification unit 16.

【0049】フォーマット登録部14は、罫線パターン
の特徴量を、登録フォーマットとして格納するものであ
る。
The format registration unit 14 stores the feature amount of the ruled line pattern as a registration format.

【0050】フォーマット読取部15は、フォーマット
登録部14に格納されている登録フォーマットを順次読
み出し、識別部16に与えるものである。
The format reading section 15 sequentially reads out the registered formats stored in the format registration section 14 and gives it to the identification section 16.

【0051】識別部16は、入力に係る罫線パターン
(以下、「入力罫線パターン」ともいう)の特徴量を、
読み出された既登録フォーマット情報の特徴量と比較す
ることにより、入力罫線パターンのフォーマットを決定
するものである。なお、識別部16には、入力罫線パタ
ーンのフォーマットの候補として挙げられた既登録フォ
ーマットを、当該入力罫線パターンのフォーマットとし
て認定するか否かを判定するためのしきい値が格納され
ている。
The discriminating unit 16 calculates a characteristic amount of a ruled line pattern relating to an input (hereinafter, also referred to as an “input ruled line pattern”)
The format of the input ruled line pattern is determined by comparing with the feature amount of the read registered format information. The identification unit 16 stores a threshold value for determining whether a registered format listed as a candidate for the input ruled line pattern format is recognized as the format of the input ruled line pattern.

【0052】(A−2)帳票フォーマット登録時の処理
動作 図4(A)、図5及び図6を参照しながら、第1実施形
態の帳票フォーマット登録・識別装置1における、帳票
フォーマット登録時の処理動作を説明する。ここで、図
4(A)は、帳票フォーマット登録時の処理の流れを示
すフローチャートであり、図5はフィルタリング対象領
域を示す図であり、図6は、種々の帳票に本実施形態に
よるフィルタリングを実行した場合における、実行前後
の変化を示す図である。
(A-2) Processing Operation When Registering Form Format Referring to FIGS. 4A, 5 and 6, the form format registration / identification device 1 according to the first embodiment performs the processing when registering the form format. The processing operation will be described. Here, FIG. 4A is a flowchart showing a flow of processing at the time of registering a form format, FIG. 5 is a diagram showing a filtering target area, and FIG. 6 is a diagram showing filtering of various forms by the present embodiment. It is a figure which shows the change before and after execution at the time of execution.

【0053】まず、帳票情報読取部11によって帳票に
記載された帳票情報が読み取られ(S11)、読み取ら
れた帳票情報がフィルタリング実行部12に与えられ
る。
First, the form information read unit 11 reads form information described in the form (S11), and the read form information is provided to the filtering execution unit 12.

【0054】フィルタリング実行部12においては、与
えられた帳票情報に対して、フィルタリングが実行され
る。ここで実行されるフィルタリングは、帳票情報内に
おける所定部分の特徴を弱める働きをするフィルタリン
グである。
In the filtering execution unit 12, filtering is performed on the given form information. The filtering performed here is a filtering function that weakens the characteristics of a predetermined portion in the form information.

【0055】前記フィルタリングは、次の手順で実行さ
れる。まず、図5に示すように、帳票情報表示領域10
0内の一部にフィルタリング対象領域101が予め指定
される。ここで、帳票情報表示領域100とは、図示し
ない表示部内の領域であって読み取られた帳票情報を表
示する領域をいう。また、フィルタリング対象領域10
1とは、フィルタリングの対象となる領域をいう。な
お、帳票情報表示領域100には、実際には、読み取ら
れた帳票情報の全てが表示されるのであるが、図5にお
いては、帳票情報のうち罫線のみを破線で示すこととし
ている。これは、罫線とフィルタリング対象領域101
の位置関係を把握しやすくするためである。
The filtering is performed in the following procedure. First, as shown in FIG.
The filtering target area 101 is specified in advance in a part of 0. Here, the form information display area 100 is an area in a display unit (not shown) that displays the read form information. The filtering target area 10
1 indicates an area to be filtered. It should be noted that although all of the read form information is actually displayed in the form information display area 100, only the ruled lines in the form information are indicated by broken lines in FIG. This is because the ruled line and the filtering target area 101
This is to make it easier to grasp the positional relationship between the objects.

【0056】また、フィルタリングの種類も予め指定さ
れている。本実施形態では、フィルタリングの種類とし
て、ぼかし処理が採用されている。本実施形態における
ぼかし処理が実行されると、フィルタリング対象領域1
01内に線図等がある場合には、フィルタリング対象領
域101の内部が黒く塗りつぶされた状態に変化するの
に対し、かかる線図等がない場合には、領域101内に
は何の変化も起こらず、元のままの状態が維持される。
即ち、ぼかし処理が実行されると、フィルタリング対象
領域101内に線図等がある場合は、領域101内が黒
く塗りつぶされるというかたちで、領域101内の線図
等が弱められることなる。このように、ぼかし処理で
は、当該領域内に線図があるか否かという点しか問題と
ならず、線図の形状そのものは、問題とならない。
The type of filtering is specified in advance. In the present embodiment, a blurring process is employed as a type of filtering. When the blurring process in the present embodiment is executed, the filtering target area 1
01 includes a line diagram, the inside of the filtering target region 101 changes to a black-out state, whereas if there is no such line diagram, there is no change in the region 101. It does not happen and remains as it is.
That is, when the blurring process is performed, if there is a diagram or the like in the filtering target region 101, the diagram or the like in the region 101 is weakened in such a manner that the inside of the region 101 is painted black. As described above, in the blurring process, it is only a matter of whether or not there is a diagram in the area, and the shape of the diagram itself does not matter.

【0057】図6は、種々の特徴を有する帳票にぼかし
処理を実行した場合の変化の具体例を示している。ここ
で、図6(A1)、図6(B1)及び図6(C1)は、
ぼかし処理実行前の状態を、図6(A2)、図6(B
2)及び6(C2)は、ぼかし処理実行後の状態を示し
ている。なお、従来技術との比較が行えるようにするた
め、図6(A1)、図6(B1)及び図6(C1)に示
された帳票にはそれぞれ、図3(A)、図3(B)及び
図3(C)に示された帳票と同じものを用いている。
FIG. 6 shows a specific example of a change when the blurring process is performed on a form having various characteristics. Here, FIG. 6 (A1), FIG. 6 (B1), and FIG.
FIGS. 6A and 6B show states before the execution of the blurring process.
2) and 6 (C2) show the state after the execution of the blurring process. In order to make a comparison with the prior art, the forms shown in FIGS. 6A1, 6B1 and 6C1 are shown in FIGS. 3A and 3B, respectively. ) And the form shown in FIG. 3C.

【0058】図6(A2)に示すように、図6(A1)
に示された帳票は、ぼかし処理を実行しても、フィルタ
リング対象領域101には何も記載されていないため、
何の変化も起こらない。これに対して、図6(B2)及
び図6(C2)に示すように、フィルタリング対象領域
101に線図等の記載事項がある場合には、内部が黒く
塗りつぶされた長方形になる。かかる変化が生じるの
は、図6(B1)及び図6(C1)の帳票には、長方形
のフィルタリング対象領域101にバーコードが存在し
たため、ぼかし処理の実行により、長方形のフィルタリ
ング対象領域101全体が黒く塗りつぶされるからであ
る。
As shown in FIG. 6 (A2), FIG.
Are not described in the filtering target area 101 even if the blur processing is executed,
No change occurs. On the other hand, as shown in FIG. 6B2 and FIG. 6C2, when there is a description such as a diagram in the filtering target area 101, it becomes a rectangle whose inside is painted black. This change occurs because the form in FIG. 6 (B1) and FIG. 6 (C1) includes a barcode in the rectangular filtering target area 101, so that the entire rectangular filtering target area 101 is subjected to the blurring processing. This is because it is painted black.

【0059】次に、罫線パターン抽出部23において、
このようにして得られたぼかし処理実行後の帳票情報か
ら、罫線パターンが抽出される(S14)。ここで、罫
線パターンの抽出にあたっては、罫線の特徴のみなら
ず、フィルタリングの実行された箇所(本実施形態の場
合、ぼかし処理実行の結果黒く塗りつぶされた箇所)の
特徴も考慮される。また、罫線パターンの抽出は、罫線
パターンの特徴量を抽出することにより行われる。本実
施形態の場合、得られる罫線パターンは、図6(A2)
に示す、図中左下に塗りつぶされた長方形を有しないも
のと、図6(B2)及び6(C2)示す、図中左下に塗
りつぶされた長方形を有するものとの2種類である。
Next, in the ruled line pattern extraction unit 23,
A ruled line pattern is extracted from the thus obtained form information after the execution of the blurring process (S14). Here, in extracting the ruled line pattern, not only the characteristics of the ruled line but also the characteristics of the filtered portion (in the present embodiment, the portion painted black as a result of the execution of the blurring process) are considered. The extraction of the ruled line pattern is performed by extracting the feature amount of the ruled line pattern. In the case of the present embodiment, the obtained ruled line pattern is as shown in FIG.
(B2) and 6 (C2) shown in FIG. 6 (B2) and FIG. 6 (C2), which have a filled rectangle at the lower left of the figure.

【0060】その後、フォーマット登録部14に、得ら
れた罫線パターンの特徴量が、帳票フォーマットとして
登録される(S14)。
Thereafter, the obtained feature amount of the ruled line pattern is registered in the format registration unit 14 as a form format (S14).

【0061】以上説明したように、本実施形態によれ
ば、ぼかし処理を実行することにより、バーコードの模
様は不問としつつ所定領域内にバーコードが存在するか
否かによって異なる罫線パターンが登録されることとな
る。
As described above, according to the present embodiment, by executing the blurring process, a ruled line pattern which differs depending on whether or not a barcode exists in a predetermined area while registering a barcode pattern regardless of the barcode pattern is registered. Will be done.

【0062】(A−3)帳票フォーマット識別処理時の
動作 図4(B)を参照しながら、帳票フォーマット識別処理
時の動作について説明する。ここで、図4(B)は、帳
票フォーマット識別処理時の動作を示すフローチャート
である。
(A-3) Operation at the time of form format identification processing The operation at the time of form format identification processing will be described with reference to FIG. Here, FIG. 4B is a flowchart showing the operation during the form format identification processing.

【0063】まず、フォーマット登録処理時と同様の手
順により、入力に係る帳票の罫線パターン(以下、「入
力罫線パターン」という)の抽出が行われる(S21〜
S23)。具体的には、帳票情報読取部11によって帳
票情報が読み取られ(S21)、フィルタリング実行部
12によって帳票情報内のの所定領域にフィルタリング
が実行され(S22)、罫線パターン抽出部23によっ
てフィルタリング実行後の帳票情報から、罫線パターン
が抽出される(S23)。
First, a ruled line pattern of an input form (hereinafter referred to as an "input ruled line pattern") is extracted by the same procedure as in the format registration process (S21 to S21).
S23). Specifically, the form information is read by the form information reading unit 11 (S21), filtering is performed on a predetermined area in the form information by the filtering execution unit 12 (S22), and the filtering is performed by the ruled line pattern extracting unit 23. The ruled line pattern is extracted from the form information (S23).

【0064】次に、入力罫線パターンの識別が行われる
(S24〜S34)。なお、以下の説明においては、フ
ォーマット登録部14に、n個(nは自然数)の登録フ
ォーマットが格納されているものと仮定する。まず、1
番目の登録フォーマットがフォーマット読取部15によ
って読み取られ(S24、S25)、識別部16によっ
て読み取られた登録フォーマットが、上記入力罫線パタ
ーンと比較され、両者間の類似度が算出される(S2
6)。2番目以降の登録フォーマットについても、同様
の手順により比較・類似度の算出が行われ(S27)、
n番目の登録フォーマットまで繰り返される(S2
8)。このようにして、n個の登録フォーマット全てに
ついて、入力罫線パターンとの類似度が算出される。
Next, the input ruled line pattern is identified (S24 to S34). In the following description, it is assumed that the format registration unit 14 stores n (n is a natural number) registered formats. First, 1
The second registered format is read by the format reading unit 15 (S24, S25), the registered format read by the identification unit 16 is compared with the input ruled line pattern, and the similarity between them is calculated (S2).
6). For the second and subsequent registration formats, comparison and similarity are calculated in the same procedure (S27).
Repeated until the n-th registration format (S2
8). In this way, the similarity to the input ruled line pattern is calculated for all of the n registered formats.

【0065】識別部16では、求められたn個の類似度
のうち最大値を示す登録フォーマットが、当該入力帳票
のフォーマットの候補として選出される。選出されたフ
ォーマット候補は、識別部26に記憶されたしきい値と
比較される(S29)。最大類似度がしきい値を超えて
いる場合は、最大類似度を示す登録フォーマットが、入
力罫線パターンのフォーマットとして決定され(S3
0)、決定されたフォーマットが、図示しない表示部に
表示される(S31)。これに対して、最大類似度がし
きい値以下の場合は、該当するフォーマットがないとの
決定がなされ(S32)、該当フォーマットは存在しな
い旨が、図示しない表示部に表示される(S33)。こ
こで、しきい値を設けているのは、入力罫線パターン
と、比較される登録フォーマットとの類似度が低い場合
には、たとえ最大類似度を示す場合であっても、当該登
録フォーマットを、当該入力罫線パターンのフォーマッ
トとして認定することは、妥当でないからである。
The identification unit 16 selects a registration format indicating the maximum value among the n similarities obtained as a candidate for the format of the input form. The selected format candidate is compared with the threshold value stored in the identification unit 26 (S29). If the maximum similarity exceeds the threshold, the registration format indicating the maximum similarity is determined as the format of the input ruled line pattern (S3).
0), the determined format is displayed on a display unit (not shown) (S31). On the other hand, if the maximum similarity is equal to or smaller than the threshold value, it is determined that there is no corresponding format (S32), and the fact that there is no corresponding format is displayed on a display unit (not shown) (S33). . Here, the threshold value is provided because, when the similarity between the input ruled line pattern and the registered format to be compared is low, even if the maximum similarity is indicated, the registered format is This is because it is not appropriate to recognize the format of the input ruled line pattern.

【0066】なお、上記類似度の算出には、通常のパタ
ーンマッチングの手法(例えば、パターン間最小距離を
用いる方法)を用いることができる。
The similarity can be calculated by a normal pattern matching method (for example, a method using the minimum distance between patterns).

【0067】かかる手順により、入力罫線パターンにつ
いてフォーマットが決定された後は、ユーザは、バーコ
ードの有無に応じて、異なる処理を行うことが可能とな
る。例えば、バーコードがあると判定された帳票につい
て、このバーコードに記録された情報を読み取るなどの
作業を行うことができる。
After the format of the input ruled line pattern is determined by the above procedure, the user can perform different processing according to the presence or absence of the barcode. For example, for a form determined to have a barcode, an operation such as reading information recorded on the barcode can be performed.

【0068】(A−4)第1実施形態の効果 以上のように、第1実施形態においては、帳票の登録を
行う際に、バーコード等が記された領域にフィルタリン
グを行うことにより、バーコード等の有無を罫線パター
ンの識別に反映させる構成、即ち、罫線パターンの識別
の上で、バーコード等模様は考慮されないがバーコード
等の有無は考慮されるという構成をとる。これにより、
罫線パターンの認識における従来技術の問題点、即ち、
罫線自体は全く同じである複数の帳票についてバーコー
ドの模様により罫線パターンが異なるものと認識される
という点や、バーコードの存在を全く無視して罫線パタ
ーンを認識してしまうという点が、解決される。
(A-4) Effects of the First Embodiment As described above, in the first embodiment, when a form is registered, filtering is performed on an area in which a barcode or the like is written, thereby reducing the bar. The configuration in which the presence or absence of a code or the like is reflected in the identification of the ruled line pattern, that is, the configuration in which the pattern such as a barcode is not considered but the presence or absence of a barcode or the like is considered in identifying the ruled line pattern. This allows
Problems of the prior art in recognizing ruled line patterns, namely,
The rule lines themselves are exactly the same.Solving the point that the rule line pattern is recognized as different depending on the bar code pattern for multiple forms, and the rule line pattern is recognized completely ignoring the existence of the bar code Is done.

【0069】さらに、バーコード等の記された帳票につ
いて、バーコードの情報を読み取るといったような、更
に進んだ処理を行うことが可能となる。
Further, it is possible to perform further advanced processing such as reading barcode information on a form on which a barcode or the like is written.

【0070】(B)第2の実施形態 第1実施形態においては、バーコード等が記された領域
にフィルタリングを実行し、バーコードの付されている
ものの場合は、当該領域が黒く塗りつぶされたものとし
て認識され、これにより、バーコード等の有無を考慮し
た罫線パターンの登録及び識別が可能となる構成をとっ
ていた。
(B) Second Embodiment In the first embodiment, filtering is performed on an area in which a barcode or the like is written, and in the case of a barcode, the area is blacked out. This makes it possible to register and identify a ruled line pattern in consideration of the presence or absence of a barcode or the like.

【0071】しかし、この構成では、バーコード等の付
されている箇所(即ち、フィルタリング対象領域)の位
置、形状、大きさ等が僅かに異なるだけで、全く別の罫
線パターンとして認識され、この結果、僅かな相違しか
ない相互に類似する登録帳票フォーマットが多数生成さ
れ、このため、登録手続や登録手続が煩雑となるという
不都合が生じうる。
However, in this configuration, the location, the shape, the size, etc., of the location where the barcode or the like is attached (ie, the filtering target area) are slightly different, and are recognized as completely different ruled line patterns. As a result, a number of mutually similar registration form formats having only slight differences are generated, which may cause a problem that the registration procedure and the registration procedure become complicated.

【0072】かかる不都合を解消すべく、第2実施形態
では、フォーマット登録時には登録フォーマットにフィ
ルタリング情報を付記するにとどめ、入力に係る帳票の
罫線パターンを識別する際に、フィルタリング情報の項
目(パラメータ)を適宜特定してフィルタリングを行う
構成を採ることとした。かかる構成により、種々のフィ
ルタ対象領域の位置、形状、大きさ等に対応できるよう
にすることとなる。
In order to solve such inconveniences, in the second embodiment, only the filtering information is added to the registration format at the time of format registration, and the items (parameters) of the filtering information are used to identify the ruled line pattern of the input form. Is appropriately specified to perform filtering. With such a configuration, it is possible to cope with various positions, shapes, sizes, and the like of the filter target regions.

【0073】(B−1)第2実施形態の構成 図7は、第2実施形態に係る帳票フォーマット登録・識
別装置2の全体構成を示している。
(B-1) Configuration of Second Embodiment FIG. 7 shows the overall configuration of a form format registration / identification device 2 according to the second embodiment.

【0074】第2実施形態の帳票フォーマット登録・識
別装置2は、帳票情報入力部21、フィルタリング情報
設定部22a、フィルタリング実行部22b、罫線パタ
ーン抽出部23、フォーマット登録部24、フォーマッ
ト読取部25、及び識別部26から構成される。
The form format registration / identification device 2 of the second embodiment includes a form information input section 21, a filtering information setting section 22a, a filtering execution section 22b, a ruled line pattern extraction section 23, a format registration section 24, a format reading section 25, And an identification unit 26.

【0075】第2実施形態の帳票フォーマット登録・識
別装置2が、第1実施形態の帳票フォーマット登録・識
別装置1と、構成上大きく異なる点は、フィルタリング
についての情報を生成するフィルタリング情報設定部2
2aが新たに設けられている点である。
The form format registration / identification apparatus 2 of the second embodiment is largely different from the form format registration / identification apparatus 1 of the first embodiment in the configuration of the filtering information setting unit 2 for generating information on filtering.
2a is newly provided.

【0076】ここで、帳票情報入力部21は、帳票情報
を読み取り、読み取った帳票情報を罫線パターン抽出部
23の与えるものである。
Here, the form information input section 21 reads the form information and gives the read form information to the ruled line pattern extracting section 23.

【0077】罫線パターン抽出部23は、与えられた帳
票情報から、罫線パターンの特徴量を抽出するものであ
る。そして、抽出した罫線パターンの特徴量を、後述す
るフィルタリング情報設定部22aで生成したフィルタ
リング情報とともに、フォーマット登録部24に与える
ものである。
The ruled line pattern extracting unit 23 extracts the characteristic amount of the ruled line pattern from the given form information. Then, the feature amount of the extracted ruled line pattern is provided to the format registration unit 24 together with the filtering information generated by the filtering information setting unit 22a described later.

【0078】フィルタリング情報設定部22aは、フィ
ルタリングの内容を特定するフィルタリング情報を設定
するものである。
The filtering information setting section 22a sets filtering information for specifying the content of filtering.

【0079】フォーマット登録部24は、罫線パターン
の特徴量にフィルタリング情報を付加したものを、登録
フォーマットとして格納するものである。
The format registering section 24 stores, as a registration format, a ruled line pattern obtained by adding filtering information to the feature amount.

【0080】フォーマット読取部25は、フォーマット
登録部24に格納されている1以上の既登録フォーマッ
トをフィルタリング情報とともに順次読み出し、フィル
タリング実行部22bに与えるものである。
The format reading section 25 sequentially reads out one or more registered formats stored in the format registration section 24 together with the filtering information, and gives it to the filtering execution section 22b.

【0081】フィルタリング実行部22bは、入力罫線
パターンと、読み取った既登録フォーマットの双方に対
して、与えられたフィルタリング情報に基づき同一のフ
ィルタリングを実行するものである。
The filtering execution unit 22b executes the same filtering on both the input ruled line pattern and the read registered format based on the given filtering information.

【0082】識別部26は、入力罫線パターンの特徴量
を、読み出された既登録フォーマット情報の特徴量と比
較することにより、入力帳票のフォーマットを決定する
ものである。また、識別部26には、入力帳票のフォー
マットの候補としてげられた既登録フォーマットが、当
該入力帳票のフォーマットとして認定するか否かを決定
するためのしきい値を格納されている。
The identification unit 26 determines the format of the input form by comparing the characteristic amount of the input ruled line pattern with the characteristic amount of the read registered format information. In addition, the identification unit 26 stores a threshold value for determining whether or not a registered format given as a candidate for the format of the input form is recognized as the format of the input form.

【0083】(B−2)帳票フォーマット登録時の処理
動作 図8(A)及び図9を参照しながら、第2実施形態の帳
票フォーマット登録・識別装置2における、フォーマッ
ト登録時の処理動作の流れを説明する。ここで、図8
(A)は、フォーマット登録時の処理の流れを示すフロ
ーチャートであり、図9はフィルタリング情報の項目
(パラメータ)を示す図である。
(B-2) Processing Operation at the Time of Form Format Registration Referring to FIGS. 8A and 9, the flow of processing operation at the time of format registration in the form format registration / identification apparatus 2 of the second embodiment will be described. Will be described. Here, FIG.
FIG. 9A is a flowchart showing the flow of processing at the time of format registration, and FIG. 9 is a diagram showing items (parameters) of filtering information.

【0084】まず、帳票情報読取部21によって帳票に
記載された帳票情報が読み取られ(S21)、読み取ら
れた帳票情報が罫線パターン抽出部23に与えられる。
First, the form information read unit 21 reads the form information described in the form (S 21), and the read form information is given to the ruled line pattern extracting unit 23.

【0085】罫線パターン抽出部23では、与えられた
帳票情報から、当該帳票の罫線パターンが抽出される
(S42)。
The ruled line pattern extracting unit 23 extracts a ruled line pattern of the form from the provided form information (S42).

【0086】次に、フィルタリング情報設定部22aに
よって、フィルタリング情報が設定される。ここで、フ
ィルタリング情報とは、フィルタリングの内容を特定す
る情報をいう。フィルタリング情報を構成する具体的な
項目(パラメータ)は、図9に示すように、フィルタリ
ングの種類、フィルタの形状、フィルタの大きさ、及び
フィルタの位置である。
Next, filtering information is set by the filtering information setting section 22a. Here, the filtering information refers to information for specifying the content of the filtering. As shown in FIG. 9, specific items (parameters) constituting the filtering information are the type of filtering, the shape of the filter, the size of the filter, and the position of the filter.

【0087】その後、フォーマット登録部24におい
て、罫線パターン抽出部23によって抽出された罫線パ
ターンに、フィルタリング情報設定部22aよって設定
されたフィルタリング情報を付加して、帳票フォーマッ
トとして登録される。
After that, the format registration unit 24 adds the filtering information set by the filtering information setting unit 22a to the ruled line pattern extracted by the ruled line pattern extraction unit 23, and registers it as a form format.

【0088】以上説明したように、第2実施形態におい
ては、フォーマット登録前はフィルタリングが実行され
ず、代わりにフィルタリング情報を設定して、登録フォ
ーマットに付加することとしている。
As described above, in the second embodiment, filtering is not executed before format registration, and instead, filtering information is set and added to the registered format.

【0089】(B−3)帳票フォーマット識別処理時の
動作 図8(B)を参照しながら、第2実施形態における帳票
フォーマット識別処理動作について説明する。ここで、
図8(B)は、帳票フォーマット識別処理時の動作を示
すフローチャートである。
(B-3) Operation in Form Format Identification Processing The form format identification processing operation in the second embodiment will be described with reference to FIG. here,
FIG. 8B is a flowchart showing the operation during the form format identification processing.

【0090】まず、帳票フォーマット登録処理時と同様
の手順により、入力に係る帳票の罫線パターンの抽出が
行われる(S51、S52)。具体的には、帳票情報読
取部11によって帳票情報が読み取られ(S51)、罫
線パターン抽出部23によって帳票情報から、罫線パタ
ーンが抽出される(S52)。
First, a ruled line pattern of an input form is extracted according to the same procedure as in the form format registration process (S51, S52). Specifically, the form information is read by the form information reading unit 11 (S51), and the ruled line pattern is extracted from the form information by the ruled line pattern extracting unit 23 (S52).

【0091】次に、入力罫線パターンの識別が行われる
(S54〜S64)。なお、以下の説明においては、フ
ォーマット登録部24に、n個(nは自然数)の登録フ
ォーマットが格納されているものと仮定する。
Next, the input ruled line pattern is identified (S54 to S64). In the following description, it is assumed that n (n is a natural number) registered formats are stored in the format registration unit 24.

【0092】まず、フォーマット読取部25によって、
1番目の登録フォーマット及びこれに付加されたフィル
タリング情報が読み取られる(S53、S54)。
First, the format reading unit 25
The first registration format and the filtering information added thereto are read (S53, S54).

【0093】次に、フィルタリング情報の各項目(パラ
メータ)がユーザによって特定される(S55)。フィ
ルタリング情報のパラメータの特定は、図示しないメニ
ューからの選択、又は図示しないキーボードからのキー
入力によりなされる。前記パラメータの特定は、例え
ば、ぼかし処理(フィルタリングの種類)、長方形(フ
ィルタの形状)、縦10ドットx横20ドット(フィル
タの大きさ)、フィルタの左下隅のドットが帳票情報表
示領域の基点(例えば帳票情報表示領域の左下隅の点)
から右へ5ドット上へ10ドット移動した位置(フィル
タの位置)、といった事項を選択することにより行われ
る。
Next, each item (parameter) of the filtering information is specified by the user (S55). The parameters of the filtering information are specified by selection from a menu (not shown) or key input from a keyboard (not shown). The parameters are specified by, for example, blurring processing (type of filtering), rectangle (filter shape), vertical 10 dots × horizontal 20 dots (filter size), and the dot at the lower left corner of the filter is the base point of the form information display area. (For example, the point at the lower left corner of the form information display area)
This is performed by selecting an item such as a position shifted 5 dots upward by 10 dots to the right (the position of the filter).

【0094】次に、フィルタリング実行部22bによっ
て、入力帳票情報と、読み取られた登録フォーマットの
双方に、上記特定されたフィルタリング情報に基づく同
一のフィルタリングが実行される(S56)。
Next, the same filtering based on the specified filtering information is performed on both the input form information and the read registration format by the filtering execution unit 22b (S56).

【0095】次に、識別部26において、同じフィルタ
リングを実行した入力罫線パターンと1番目の登録フォ
ーマットとを比較し、両者の類似度が求められる(S5
7)。
Next, the identification unit 26 compares the input ruled line pattern that has been subjected to the same filtering with the first registered format, and determines the similarity between the two (S5).
7).

【0096】2番目以降の登録フォーマットについて
も、同様の手順により上記比較・類似度の算出を行い
(S58)、n番目の登録フォーマットまで繰り返す
(S59)。以上の手順により、n個の既登録フォーマ
ット全てについて、入力罫線パターンとの類似度が算出
される。
For the second and subsequent registration formats, the above-described comparison and similarity are calculated in the same procedure (S58), and the process is repeated until the n-th registration format (S59). With the above procedure, the similarity with the input ruled line pattern is calculated for all of the n registered formats.

【0097】識別部26では、求められたn個の類似度
の中から、最大値を示すものが選出され、かかる最大類
似度が、識別部26に記憶されているしきい値と比較さ
れる(S60)。最大類似度がしきい値を超えている場
合は、最大類似度を示す登録フォーマットが、入力罫線
パターンのフォーマットとして決定され(S61)、決
定されたフォーマットが、図示しない表示部に表示され
る(S62)。これに対して、最大類似度がしきい値以
下の場合は、該当フォーマットがないとの決定がなされ
(S63)、該当フォーマットがない旨が、図示しない
表示部に表示される(S64)。
In the discriminating section 26, the one showing the maximum value is selected from the obtained n similarities, and this maximum similarity is compared with the threshold value stored in the discriminating section 26. (S60). If the maximum similarity exceeds the threshold, the registration format indicating the maximum similarity is determined as the format of the input ruled line pattern (S61), and the determined format is displayed on a display unit (not shown) ( S62). On the other hand, when the maximum similarity is equal to or smaller than the threshold, it is determined that there is no corresponding format (S63), and the fact that there is no corresponding format is displayed on a display unit (not shown) (S64).

【0098】以上のような構成・動作をとる第2実施形
態では、第1実施形態に比べ、登録すべきフォーマット
の数が大幅に減少する。例えば、第1実施形態では、図
6に示す例では、図6(A2)に示すものと図6(B
2)及び図6(C2)に示すものという2つのフォーマ
ットを登録する必要があるのに対して、第2実施形態で
は、図6(A2)に示す罫線パターンにフィルタリング
情報を付加したものを登録すれば、図6(A1)から図
6(C1)までの全ての帳票に対応できる。このため、
登録及び識別処理が簡略化される。かかる効果は、類似
の帳票の数が増えれば、さらに顕著となる。
In the second embodiment having the above configuration and operation, the number of formats to be registered is greatly reduced as compared with the first embodiment. For example, in the first embodiment, in the example shown in FIG. 6, the one shown in FIG.
2) and the format shown in FIG. 6 (C2) needs to be registered, whereas in the second embodiment, the ruled line pattern shown in FIG. 6 (A2) with filtering information added is registered. Then, all forms from FIG. 6 (A1) to FIG. 6 (C1) can be handled. For this reason,
The registration and identification process is simplified. This effect becomes more remarkable as the number of similar forms increases.

【0099】(B−4)第2実施形態の効果 以上説明したように、第2実施形態においては、フィル
タリングをフォーマット登録前は行わずに、入力罫線パ
ターンを識別する際に、フォーマット登録時に登録した
フィルタリング情報に基づき、入力罫線パターン及び登
録フォーマットの双方に実行する構成をとる。このた
め、フィルタリング情報のパラメータを変えるだけで、
種々のフィルタリングを行うことができる。その結果、
フォーマットとして登録べきものの数を、格段に少なく
することができる。
(B-4) Effects of the Second Embodiment As described above, in the second embodiment, the filtering is not performed before the format registration, and when the input ruled line pattern is identified, the filtering is performed at the time of format registration. Based on the filtering information thus obtained, a configuration is executed for both the input ruled line pattern and the registered format. Therefore, just by changing the parameters of the filtering information,
Various filterings can be performed. as a result,
The number of formats to be registered can be significantly reduced.

【0100】(C)他の実施形態 (C−1)上記実施形態では、フィルタリングの種類と
して、ぼかし処理を挙げたが、特徴を弱める働きをする
ものであればこれに限られず、モザイク処理、強調処理
及びその他の画像処理のいずれであってもよい。なお、
これらのフィルタリング種類は、単独で適用してもよ
く、また、適宜組み合わせて適用してもよい。
(C) Other Embodiments (C-1) In the above embodiment, the type of filtering is described as a blurring process. However, the type of filtering is not limited to this as long as it has a function of weakening features. Any of enhancement processing and other image processing may be used. In addition,
These filtering types may be applied alone, or may be applied in an appropriate combination.

【0101】(C−2)上記実施形態では、入力帳票の
フォーマットの決定は、最大類似度を示す1つの既登録
フォーマットを入力帳票のフォーマットの候補として選
出し、選出した候補をしきい値と比較することにより行
った。しかし、類似度を判定する項目の選択の仕方によ
っては、最大類似度を示す既登録フォーマットが必ずし
も、当該入力帳票のフォーマットとして最適でない場合
がありうる。そこで、入力帳票のフォーマットの候補と
して、既登録フォーマットのうち類似度の高いものから
順に複数個選択し、かかる複数候補の中から、目視によ
る全体観察により最適のものを選択するよう構成しても
よい。
(C-2) In the above embodiment, the format of the input form is determined by selecting one registered format indicating the maximum similarity as a candidate for the format of the input form, and setting the selected candidate as a threshold value. The comparison was performed. However, the registered format indicating the maximum similarity may not always be optimal as the format of the input form, depending on how the item for determining the similarity is selected. Therefore, a configuration may be adopted in which a plurality of registered formats are selected in order from the registered format in descending order of similarity, and an optimal format is selected from the plurality of candidates by visual observation as a whole. Good.

【0102】(C−3)上記実施形態では、フィルタリ
ングの対象がバーコードである場合について説明した
が、フィルタリングの対象は、これに限られず、帳票内
の押印の有無の判別に用いることもできる。例えば、押
印欄にフィルタリングとしてのぼかし処理をせば、押印
があるものについては、ぼかし処理を施した部分が黒く
塗りつぶされるのに対し、押印がない場合は変化がな
い。これにより、押印欄に押印のされている帳票と押印
されていない帳票を区別したうえで、押印されていない
ものについては、帳票記入者に押印を促すなどの、更な
る処理を行うことが可能となる。
(C-3) In the above embodiment, the case where the object of filtering is a barcode has been described. However, the object of filtering is not limited to this, and can be used to determine the presence or absence of a seal in a form. . For example, if the stamp field is subjected to filtering as a filtering process, the portion subjected to the stamp process is painted black while the portion with the stamp is black, whereas there is no change if there is no stamp. As a result, it is possible to distinguish between forms that are stamped in the seal box and forms that are not stamped, and for those that are not stamped, it is possible to perform further processing such as urging the person who fills the form to stamp it. Becomes

【0103】(C−4)また、出金伝票と入金伝票と関
係のように、「出金」と「入金」の文字のみ異なり、他
の部分は同じ帳票を同一フォーマットとして扱いたい場
合は、「出金」と「入金」という異なる文字部分にフィ
ルタリングを実行すれば、同一フォーマットとして扱う
ことができる。
(C-4) Further, as in the relationship between the withdrawal slip and the deposit slip, only the characters of "withdrawal" and "payment" are different, and the other parts are to be handled in the same form as the same format. If filtering is performed on different character portions such as "payment" and "payment", they can be treated as the same format.

【0104】(C−5)同様に、同一の罫線特徴を有す
る複数の帳票であって宛先のみ異なる帳票を、同一フォ
ーマットとして扱いたい場合は、宛先の欄にフィルタリ
ングを実行すれば、これが可能となる。これにより、同
一罫線の帳票につき、宛先名の付されているものといな
いものを区別した上、宛先名の付されているものについ
ては、宛先名が正しく付されているかを検討する、とい
うことが可能となる。
(C-5) Similarly, if it is desired to treat a plurality of forms having the same ruled line characteristic but different destinations as the same format, this can be achieved by executing filtering in the destination column. Become. In this way, for forms with the same ruled line, those with the destination name are distinguished from those without the destination name, and for those with the destination name, it is examined whether the destination name is correctly attached. Becomes possible.

【0105】(C−6)さらに、本発明のフィルタリン
グを文字列に施し、文字列の識別に利用することもでき
る。例えば、氏名のうち、名の部分のみにフィルタリン
グを施せば、姓の別によって帳票を区別することができ
る。また、住所の都道府県名以外の部分にフィルタリン
グを施せば、都道府県名別に帳票を区別することができ
る。
(C-6) Further, the filtering according to the present invention can be applied to a character string to be used for character string identification. For example, if only the first part of the name is filtered, the form can be distinguished by the last name. In addition, if filtering is applied to a part of the address other than the prefecture name, the form can be distinguished by the prefecture name.

【0106】[0106]

【発明の効果】(1)帳票の登録を行う際に、バーコー
ド等が記された領域にフィルタリングを実行することに
より、バーコード等の有無を罫線パターンの識別に反映
させる構成、即ち、罫線パターンの識別の上で、バーコ
ード等模様は問題とならないが、バーコード等の有無は
問題となるという構成をとる。これにより、罫線自体は
全く同じである複数の帳票についてバーコードの模様に
より罫線パターンが異なるものと認識されたり、また、
バーコードを全く無視してしまうといった従来技術の弊
害を除去することができる。また、バーコードの記され
た帳票について、バーコードの情報を読み取るといった
ような、更に進んだ処理を行うことが可能となる。
(1) When registering a form, filtering is performed on an area in which a barcode or the like is written, so that the presence or absence of a barcode or the like is reflected in the identification of a ruled line pattern, that is, a ruled line. In the identification of the pattern, a pattern such as a barcode is not a problem, but the presence or absence of a barcode is a problem. As a result, the ruled line pattern is recognized to be different depending on the barcode pattern for a plurality of forms having exactly the same ruled line,
The disadvantages of the prior art, such as completely ignoring the barcode, can be eliminated. Further, it is possible to perform further advanced processing such as reading barcode information on a form on which a barcode is written.

【0107】(2)また、フォーマット登録時ではな
く、入力罫線パターンを識別する時点において、フォー
マット登録時に登録したフィルタリング情報に基づくフ
ィルタリングを、入力罫線パターン及び登録フォーマッ
トの双方に実行する構成をとる。このため、フィルタリ
ング情報のパラメータを変えるだけで、種々のフィルタ
リングを行うことができる。その結果、フォーマットと
して登録べきものの数を、格段に少なくすることができ
る。
(2) Filtering based on the filtering information registered at the time of format registration is executed for both the input ruled line pattern and the registered format at the time of identifying the input ruled line pattern, not at the time of format registration. Therefore, various filterings can be performed only by changing the parameters of the filtering information. As a result, the number of formats to be registered can be significantly reduced.

【図面の簡単な説明】[Brief description of the drawings]

【図1】第1実施形態の帳票フォーマット登録・識別装
置の構成を示す機能ブロック図である。
FIG. 1 is a functional block diagram illustrating a configuration of a form format registration / identification device according to a first embodiment.

【図2】従来の帳票フォーマット登録・識別装置の構成
を示す機能ブロック図である。
FIG. 2 is a functional block diagram showing a configuration of a conventional form format registration / identification device.

【図3】従来の帳票フォーマット登録・識別装置にかけ
られた種々の帳票を示す図である。
FIG. 3 is a diagram showing various forms applied to a conventional form format registration / identification apparatus.

【図4】第1実施形態に係る帳票フォーマット登録・識
別装置の動作を示すフローチャートである。
FIG. 4 is a flowchart showing an operation of the form format registration / identification device according to the first embodiment.

【図5】第1実施形態に係るフィルタリング対象領域を
示す図である。
FIG. 5 is a diagram showing a filtering target area according to the first embodiment.

【図6】第1実施形態において、種々の帳票にフィルタ
リングを実行した前後の状態を示す図である。
FIG. 6 is a diagram illustrating states before and after filtering is performed on various forms in the first embodiment.

【図7】第2実施形態の帳票フォーマット登録・識別装
置の構成を示す機能ブロック図である。
FIG. 7 is a functional block diagram illustrating a configuration of a form format registration / identification device according to a second embodiment.

【図8】第2実施形態に係る帳票フォーマット登録・識
別装置の動作を示すフローチャートである。
FIG. 8 is a flowchart showing an operation of a form format registration / identification device according to the second embodiment.

【図9】第2実施形態に係るフィルタリング情報の項目
(パラメータ)を示す図である。
FIG. 9 is a diagram showing items (parameters) of filtering information according to the second embodiment.

【符号の説明】[Explanation of symbols]

11,21…帳票情報入力部、22a…フィルタリング
情報設定部、12,22b…フィルタリング実行部、1
3,23…罫線パターン抽出部、14,24…フォーマ
ット登録部、15,25…フォーマット読取部、16,
26…識別部。
11, 21 ... form information input unit, 22a ... filtering information setting unit, 12, 22b ... filtering execution unit, 1
3, 23 ... ruled line pattern extraction unit, 14, 24 ... format registration unit, 15, 25 ... format reading unit, 16,
26 ... Identifier.

Claims (15)

【特許請求の範囲】[Claims] 【請求項1】 入力された帳票情報の所定部分に、特徴
を弱めるフィルタリングを実行する手段と、 前記フィルタリングの実行された帳票情報から罫線パタ
ーンの特徴量を抽出する手段と、 抽出された罫線パターンの特徴量を、帳票フォーマット
情報として登録する手段とを備えたことを特徴とする帳
票フォーマット登録・識別装置。
1. A means for performing filtering for weakening a feature on a predetermined portion of input form information, a means for extracting a feature amount of a ruled line pattern from the filtered form information, and an extracted ruled line pattern Means for registering the characteristic amount as form format information.
【請求項2】 入力された帳票情報の所定部分に、特徴
を弱めるフィルタリングを実行する手段と、 前記フィルタリングの実行された帳票情報から罫線パタ
ーンの特徴量を抽出する手段と、 抽出された罫線パターンの特徴量を既登録帳票フォーマ
ット情報の特徴量と比較することにより、入力帳票情報
に係る帳票のフォーマットを決定する手段とを備えたこ
とを特徴とする帳票フォーマット登録・識別装置。
2. A means for performing filtering for weakening a feature on a predetermined portion of the input form information, a means for extracting a feature amount of a ruled line pattern from the filtered form information, and an extracted ruled line pattern Means for determining a format of a form associated with input form information by comparing the characteristic amount of the form with the characteristic amount of the registered form format information.
【請求項3】 入力された帳票情報から罫線パターンの
特徴量を抽出する手段と、 特徴を弱めるフィルタリングの内容を特定するためのフ
ィルタリング情報を生成する手段と、 抽出された罫線パターンの特徴量に、生成したフィルタ
リング情報を付加して帳票フォーマット情報を作成し、
作成した帳票フォーマット情報を登録する手段とを備え
たことを特徴とする帳票フォーマット登録・識別装置。
3. A means for extracting a feature amount of a ruled line pattern from input form information; a means for generating filtering information for specifying the content of filtering for weakening a feature; , Create the form format information by adding the generated filtering information,
Means for registering the created form format information.
【請求項4】 入力された帳票情報から罫線パターンの
特徴量を抽出する手段と、 1以上の既登録帳票フォーマット情報をこれに付加され
ているフィルタリング情報とともに順次読み出す手段
と、 抽出された罫線パターンの特徴量と読み出された登録帳
票フォーマット情報の特徴量の双方に、読み出されたフ
ィルタリング情報に基づく同一のフィルタリングを実行
する手段と、 フィルタリング実行後の入力罫線パターンの特徴量と登
録フォーマット情報の特徴量とを比較することにより、
入力罫線パターンのフォーマットを決定する手段とを備
えたことを特徴とする帳票フォーマット登録・識別装
置。
4. A means for extracting a feature amount of a ruled line pattern from input form information, a means for sequentially reading one or more registered form format information together with filtering information added thereto, and an extracted ruled line pattern Means for performing the same filtering based on the read filtering information for both the characteristic amount of the input form information and the characteristic amount of the read registration form format information; By comparing with the feature amount of
Means for determining a format of an input ruled line pattern.
【請求項5】 前記特徴を弱めるフィルタリングは、ぼ
かし処理、モザイク処理及び強調処理のうちのいずれか
又はこれらの組合せであることを特徴とする、請求項1
〜4のいずれかに記載の帳票フォーマット登録・識別装
置。
5. The method according to claim 1, wherein the filtering for weakening the feature is any one of a blurring process, a mosaic process, and an enhancement process, or a combination thereof.
A form format registration / identification apparatus according to any one of claims 1 to 4.
【請求項6】 入力された帳票情報の所定部分に、特徴
を弱めるフィルタリングを実行し、 前記フィルタリングを実行した帳票情報から罫線パター
ンの特徴量を抽出し、 抽出された罫線パターンの特徴量を当該帳票のフォーマ
ット情報として登録する、 ことを特徴とする帳票フォーマット登録・識別方法。
6. A predetermined portion of the input form information is subjected to filtering for weakening a feature, a feature amount of a ruled line pattern is extracted from the filtered form information, and the feature amount of the extracted ruled line pattern is extracted. A form format registration and identification method characterized in that the form format information is registered.
【請求項7】 入力された帳票情報の所定部分に、特徴
を弱めるフィルタリングを実行し、 前記フィルタリングを行った入力帳票情報から入力罫線
パターンの特徴量を抽出し、 入力罫線パターンの特徴量を、予め登録されているフォ
ーマット情報の特徴量と比較することにより、入力罫線
パターンのフォーマットを決定する、 ことを特徴とする 帳票フォーマット登録・識別方法。
7. Filtering for weakening a feature in a predetermined portion of the input form information, extracting a feature amount of an input ruled line pattern from the filtered input form information, A form format registration / identification method, wherein a format of an input ruled line pattern is determined by comparing with a feature amount of format information registered in advance.
【請求項8】 入力された帳票情報から入力罫線パター
ンの特徴量を抽出し、 特徴を弱めるフィルタリングを実行するためのフィルタ
リング情報を生成し、 抽出した罫線パターンの特徴量に、生成したフィルタリ
ング情報を付加してフォーマット情報として登録する、 ことを特徴とする帳票フォーマット登録・識別方法。
8. A feature amount of an input ruled line pattern is extracted from input form information, filtering information for executing filtering for weakening the feature is generated, and the generated filtering information is added to the feature amount of the extracted ruled line pattern. A form format registration / identification method characterized by adding and registering as format information.
【請求項9】 入力された帳票情報から入力罫線パター
ンの特徴量を抽出し、 1以上の登録フォーマット情報を、これに付加されたフ
ィルタリング情報とともに順次読み出し、 抽出された入力罫線パターンの特徴量と読み出された登
録フォーマット情報の特徴量の双方に、読み出されたフ
ィルタリング情報に基づく同一のフィルタリングを実行
し、 フィルタリング実行後の入力罫線パターンの特徴量と登
録フォーマット情報の特徴量とを比較することにより、
入力罫線パターンのフォーマットを決定することを特徴
とする帳票フォーマット登録・識別方法。
9. A feature amount of an input ruled line pattern is extracted from the input form information, one or more registered format information is sequentially read out together with filtering information added thereto, and a feature amount of the extracted input ruled line pattern is extracted. The same filtering based on the read filtering information is performed on both the read feature information of the registered format information, and the feature value of the input ruled line pattern after the filtering is performed is compared with the feature value of the registered format information. By doing
A form format registration / identification method characterized by determining the format of an input ruled line pattern.
【請求項10】 前記特徴を弱めるフィルタリングは、
ぼかし処理、モザイク処理及び強調処理のうちのいずれ
か又はこれらの組合せであることを特徴とする、請求項
6〜9のいずれかに記載の帳票フォーマット登録・識別
方法。
10. The filtering for weakening the feature,
The form format registration / identification method according to any one of claims 6 to 9, wherein the form format is any one of a blur process, a mosaic process, and an emphasis process or a combination thereof.
【請求項11】 入力された帳票情報の所定部分に、特
徴を弱めるフィルタリングを実行し、 前記フィルタリングを実行した帳票情報から罫線パター
ンの特徴量を抽出し、抽出された罫線パターンの特徴量
を当該帳票のフォーマット情報として登録することを特
徴とする帳票フォーマット登録・識別プログラム。
11. A filter for weakening a feature is performed on a predetermined portion of the input form information, a feature amount of a ruled line pattern is extracted from the filtered form information, and the extracted feature amount of the ruled line pattern is calculated. A form format registration / identification program characterized by registering as form format information.
【請求項12】 入力された帳票情報の所定部分に、特
徴を弱めるフィルタリングを実行し、 前記フィルタリングを行った入力帳票情報から入力罫線
パターンの特徴量を抽出し、 入力罫線パターンの特徴量を、予め登録されているフォ
ーマット情報の特徴量と比較することにより、入力罫線
パターンのフォーマットを決定することを特徴とする帳
票フォーマット登録・識別プログラム。
12. A predetermined portion of the input form information is subjected to a filtering for weakening a feature, a feature amount of an input ruled line pattern is extracted from the filtered input form information, and a feature amount of the input ruled line pattern is calculated. A form format registration / identification program characterized in that a format of an input ruled line pattern is determined by comparing with a feature amount of format information registered in advance.
【請求項13】 入力された帳票情報から入力罫線パタ
ーンの特徴量を抽出し、 特徴を弱めるフィルタリングを実行するためのフィルタ
リング情報を生成し、 抽出した罫線パターンの特徴量に、生成したフィルタリ
ング情報を付加してフォーマット情報として登録するこ
とを特徴とする帳票フォーマット登録・識別プログラ
ム。
13. Extracting a feature amount of an input ruled line pattern from input form information, generating filtering information for executing filtering for weakening the feature, and applying the generated filtering information to the feature amount of the extracted ruled line pattern. A form format registration / identification program characterized by being added and registered as format information.
【請求項14】 入力された帳票情報から入力罫線パタ
ーンの特徴量を抽出し、 1以上の登録フォーマット情報を、これに付加されたフ
ィルタリング情報とともに順次読み出し、 抽出された入力罫線パターンの特徴量と読み出された登
録フォーマット情報の特徴量の双方に、読み出されたフ
ィルタリング情報に基づく同一のフィルタリングを実行
し、 フィルタリング実行後の入力罫線パターンの特徴量と登
録フォーマット情報の特徴量とを比較することにより、
入力罫線パターンのフォーマットを決定する、 ことを特徴とする帳票フォーマット登録・識別プログラ
ム。
14. A feature amount of an input ruled line pattern is extracted from input form information, one or more registered format information is sequentially read out together with filtering information added thereto, and a feature amount of the extracted input ruled line pattern is extracted. The same filtering based on the read filtering information is performed on both the read characteristic information of the registered format information, and the characteristic value of the input ruled line pattern after the filtering is performed is compared with the characteristic value of the registered format information. By
A form format registration / identification program, which determines the format of an input ruled line pattern.
【請求項15】 前記特徴を弱めるフィルタリングは、
ぼかし処理、モザイク処理及び強調処理のうちのいずれ
か又はこれらの組合せであることを特徴とする、請求項
11〜14のいずれかに記載の帳票フォーマット登録・
識別プログラム。
15. The filtering for weakening the feature,
15. The form format registration / registration according to any one of claims 11 to 14, wherein the form processing is any one of a blur processing, a mosaic processing, and an emphasis processing or a combination thereof.
Identification program.
JP2001163783A 2001-05-31 2001-05-31 Device, method and program for registering and identifying document format Pending JP2002358521A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001163783A JP2002358521A (en) 2001-05-31 2001-05-31 Device, method and program for registering and identifying document format

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001163783A JP2002358521A (en) 2001-05-31 2001-05-31 Device, method and program for registering and identifying document format

Publications (1)

Publication Number Publication Date
JP2002358521A true JP2002358521A (en) 2002-12-13

Family

ID=19006689

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001163783A Pending JP2002358521A (en) 2001-05-31 2001-05-31 Device, method and program for registering and identifying document format

Country Status (1)

Country Link
JP (1) JP2002358521A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015176282A (en) * 2014-03-14 2015-10-05 オムロン株式会社 Image processing method, image processor, program for executing the same method, and recording medium for recording the same program
JP2018036835A (en) * 2016-08-31 2018-03-08 富士ゼロックス株式会社 Form management device and program
JP2019079347A (en) * 2017-10-25 2019-05-23 ネットスマイル株式会社 Character estimation system, character estimation method, and character estimation program
WO2020044537A1 (en) * 2018-08-31 2020-03-05 株式会社Pfu Image comparison device, image comparison method, and program
JP6960646B1 (en) * 2021-03-23 2021-11-05 株式会社 YSK e−com Reading system, reading program and reading method
JP7487520B2 (en) 2020-03-27 2024-05-21 富士フイルムビジネスイノベーション株式会社 Information processing device, image reading device, and program

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015176282A (en) * 2014-03-14 2015-10-05 オムロン株式会社 Image processing method, image processor, program for executing the same method, and recording medium for recording the same program
JP2018036835A (en) * 2016-08-31 2018-03-08 富士ゼロックス株式会社 Form management device and program
JP2019079347A (en) * 2017-10-25 2019-05-23 ネットスマイル株式会社 Character estimation system, character estimation method, and character estimation program
WO2020044537A1 (en) * 2018-08-31 2020-03-05 株式会社Pfu Image comparison device, image comparison method, and program
JPWO2020044537A1 (en) * 2018-08-31 2021-03-18 株式会社Pfu Image matching device, image matching method, and program
JP7487520B2 (en) 2020-03-27 2024-05-21 富士フイルムビジネスイノベーション株式会社 Information processing device, image reading device, and program
JP6960646B1 (en) * 2021-03-23 2021-11-05 株式会社 YSK e−com Reading system, reading program and reading method

Similar Documents

Publication Publication Date Title
JP5623079B2 (en) Automatic generation of form definitions from hardcopy forms
JP4443576B2 (en) Pattern separation / extraction program, pattern separation / extraction apparatus, and pattern separation / extraction method
JP4996940B2 (en) Form recognition device and program thereof
CA2341108A1 (en) Method and apparatus for identification of documents, and computer product
JP2010157107A (en) Business document processor
US7796817B2 (en) Character recognition method, character recognition device, and computer product
JP2008145611A (en) Information processor and program
US20070071278A1 (en) Method and computer-readable medium for shuffling an asian document image
CN109726369A (en) A kind of intelligent template questions record Implementation Technology based on normative document
US20020054706A1 (en) Image retrieval apparatus and method, and computer-readable memory therefor
JP2002358521A (en) Device, method and program for registering and identifying document format
JP4983464B2 (en) Form image processing apparatus and form image processing program
JP4566510B2 (en) Form recognition device and form recognition method
JP2008243016A (en) Character recognition method, character recognition program and character recognition device
JP2003223610A (en) Character recognizing device and character recognizing method
JP3730073B2 (en) Template creation method, apparatus, and recording medium recording template creation program
JP2001005804A (en) Data base registering method utilizing character recognizing device
JPH1063744A (en) Method and system for analyzing layout of document
US7110600B1 (en) Document identifying device and method
JP3090070B2 (en) Form identification method and device
JP7037237B1 (en) Data processing equipment, data processing methods and programs
JP4109738B2 (en) Image processing method and apparatus and storage medium therefor
JP2004164376A (en) Identification-code-attached form, form reading program, and form creation program
JPH07152856A (en) Optical character reader
JP2003115028A (en) Method for automatically generating document identification dictionary and document processing system