JP3145264B2 - Character extraction device - Google Patents

Character extraction device

Info

Publication number
JP3145264B2
JP3145264B2 JP02665195A JP2665195A JP3145264B2 JP 3145264 B2 JP3145264 B2 JP 3145264B2 JP 02665195 A JP02665195 A JP 02665195A JP 2665195 A JP2665195 A JP 2665195A JP 3145264 B2 JP3145264 B2 JP 3145264B2
Authority
JP
Japan
Prior art keywords
character
area
cut
cutout
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP02665195A
Other languages
Japanese (ja)
Other versions
JPH08221516A (en
Inventor
好憲 大熊
晃治 伊東
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP02665195A priority Critical patent/JP3145264B2/en
Publication of JPH08221516A publication Critical patent/JPH08221516A/en
Application granted granted Critical
Publication of JP3145264B2 publication Critical patent/JP3145264B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】この発明は帳票の画像パタンから
文字パタンを切り出すための文字切出し装置に関するも
のである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character extracting device for extracting a character pattern from a form image pattern.

【0002】[0002]

【従来の技術】従来の文字認識においては、文字パタン
を認識用辞書と照合するために、1文字単位に文字パタ
ンを切り出す。文字1個分の記入領域を画成する文字枠
が印刷されている帳票の場合は、個々の文字枠の位置が
予め判っており従ってこの枠位置を切出し位置に用いる
ことができるので、切出し位置を検出するための処理を
行なわずに済む。これに対し、文字複数個分の記入領域
を画成する文字欄は印刷されているが文字枠は印刷され
ていない帳票の場合には、文字欄に記載されている個々
の文字毎に切出し位置を検出するための処理が必要とな
る。
2. Description of the Related Art In conventional character recognition, a character pattern is cut out in units of one character in order to collate the character pattern with a recognition dictionary. In the case of a form in which a character frame defining an entry area for one character is printed, the position of each character frame is known in advance, and this frame position can be used as a cutout position. Does not need to be performed. On the other hand, in the case of a form in which a character column that defines an entry area for a plurality of characters is printed but a character frame is not printed, a cutout position is set for each character described in the character column. Requires a process for detecting.

【0003】このような文字枠が印刷されていない帳票
の文字パタンを切り出すための従来装置として、例えば
特開昭61−195474号公報に開示されているもの
がある。
A conventional apparatus for cutting out a character pattern of a form on which such a character frame is not printed is disclosed, for example, in Japanese Patent Application Laid-Open No. 61-195474.

【0004】[0004]

【発明が解決しようとする課題】しかしながら上述の公
報に開示されている従来装置にあっては、a)複数個の
文字パタンを含む文字列パタンから基本パタンを検出す
る;b)切出し用辞書と整合する基本パタンを検出す
る;c)切出し用辞書と整合しなかった基本パタンに関
しては、単独の基本パタンについて切出し評価値を求め
ると共に、組み合わせ可能な全ての基本パタンの組み合
わせについて個々に切出し評価値を求める;c)切出し
評価値を参照して最適な切出し位置を決定するという処
理により、切出し位置の検出を行なう。このように基本
パタンを切出し用辞書と照合する処理と、基本パタン単
独について切出し評価値を求める処理と、組み合わせ可
能な全ての基本パタンの組み合わせについて切出し評価
値を求める処理とが必要であるので、切出し位置検出処
理が複雑になり従って処理速度が遅くなる。また切出し
用辞書を記憶するために容量の大きなメモリが必要にな
る。
However, in the conventional apparatus disclosed in the above-mentioned publication, a) a basic pattern is detected from a character string pattern including a plurality of character patterns; C) detecting a matching basic pattern; c) for a basic pattern that does not match the cut-out dictionary, obtains a cut-out evaluation value for a single basic pattern and individually obtains a cut-out evaluation value for all possible combinations of basic patterns; C) The extraction position is detected by a process of determining the optimum extraction position with reference to the extraction evaluation value. As described above, the process of matching the basic pattern with the extraction dictionary, the process of obtaining the extraction evaluation value for the basic pattern alone, and the process of obtaining the extraction evaluation value for all possible combinations of the basic patterns are necessary. The cutout position detection process becomes complicated, and the processing speed is reduced. In addition, a large-capacity memory is required to store the extraction dictionary.

【0005】この発明の目的は上述した従来の問題点を
解決するため、より単純な処理で切出し位置を検出する
ことのできる文字切出し装置を提供することにある。
An object of the present invention is to provide a character extracting apparatus which can detect an extracting position by a simpler process in order to solve the above-mentioned conventional problems.

【0006】[0006]

【課題を解決するための手段】この目的を達成するた
め、この発明の文字切出し装置は、切出し対象文字が記
入される記入領域と当該記入領域に対応する属性判別領
域とを有する帳票の画像パタンから、切出し対象文字パ
タンを切り出す文字切出し装置において、属性判別領域
の画像パタンを走査して周辺分布を作成し、この属性判
別領域の周辺分布を用いて属性判別領域のチェックの有
無を検出し当該検出結果に対応した切出し許容個数の上
限値及び下限値を設定する切出し許容数設定手段と、記
入領域の画像パタンから文字要素パタンを検出し、この
文字要素パタンの検出位置を用いて仮の切出し位置を設
定し、この仮の切出し位置を用いて記入領域の仮の切出
し文字総個数を求め、仮の切出し文字総個数が、切出し
許容個数の上限値よりも大きいとき及び切出し許容個数
の下限値よりも小さいときは、仮の切出し位置を補正す
ると共に当該補正位置を用いて仮の切出し文字総個数を
求め直し、仮の切出し文字総個数が、切出し許容個数の
上限値以下であってかつ切出し許容個数の下限値以上と
なったとき、当該仮の切出し文字総個数を得た仮の切出
し位置を、対象パタン切出し位置として決定する切出し
位置決定手段と、対象パタン切出し位置を用いて切出し
対象文字パタンを切り出すパタン読出し手段とを備えて
成ることを特徴とする。
In order to achieve this object, a character extracting apparatus according to the present invention provides an image pattern of a form having an entry area in which a character to be extracted is entered and an attribute determination area corresponding to the entry area. Then, in a character extraction device that extracts an extraction target character pattern, a peripheral distribution is created by scanning an image pattern of an attribute determination area, and the presence or absence of a check of an attribute determination area is detected using the peripheral distribution of the attribute determination area to detect A cutout allowable number setting means for setting an upper limit value and a lower limit value of the cutout allowable number corresponding to the detection result, and a character element pattern is detected from the image pattern of the entry area, and provisional cutout is performed using the detected position of the character element pattern. Set the position and calculate the total number of temporary cutout characters in the entry area using this temporary cutout position. Is larger than the lower limit of the allowable number of cutout characters, the temporary cutout position is corrected, and the total number of temporary cutout characters is calculated again using the corrected position. When the number is equal to or less than the upper limit of the number and equal to or greater than the lower limit of the allowable number of cutouts, a cutout position determining unit that determines a tentative cutout position that obtains the tentative cutout character total number as a target pattern cutout position, Pattern reading means for extracting a character pattern to be extracted using the target pattern extraction position.

【0007】[0007]

【作用】このような構成の発明によれば、帳票の使用に
関し、以下に述べる状況1)、2)が存在することを利
用する。
According to the invention having such a configuration, the use of the form utilizes the fact that the following situations 1) and 2) exist.

【0008】1)帳票の記入者は、記入領域に切出し対
象文字を記入すると共に、当該切出し対象文字の属性に
応じて選択した一又は複数の属性判別領域にチェックを
付す。従って切出し対象文字は属性判別領域のチェック
の有無に応じた属性を有する。
1) A person who fills out a form writes a character to be cut out in a writing area and checks one or a plurality of attribute discrimination areas selected according to the attribute of the character to be cut out. Therefore, the extraction target character has an attribute according to whether or not the attribute determination area is checked.

【0009】2)記入される切出し対象文字の総個数と
属性判別領域のチェックの有無との間には、相関関係が
存在し、この相関関係に基づいて、記入される切出し対
象文字の総個数の上限値Gmax 及び下限値Gmin を蓄積
しておくことができる。
2) There is a correlation between the total number of characters to be extracted to be written and whether or not the attribute discrimination area is checked, and the total number of characters to be extracted to be written is based on this correlation. it can be the previously accumulated upper limit value G max and the lower limit value G min.

【0010】このような状況1)、2)が存在する典型
的な帳票の例は、住所を記入するようにした帳票であ
る。
A typical example of a form in which such situations 1) and 2) exist is a form in which an address is entered.

【0011】例えば、記入者が在住する都道府県の名称
を記入するようにした記入領域と当該領域に対する4個
の属性判別領域とを有し、都、道、府及び県の文字がそ
れぞれ個別の属性判別領域に印刷されている帳票の場合
を考える。この場合、4つの属性判別領域のうちのいず
れかひとつのみにチェックが付されていることとなる。
東京在住の記入者であれば、記入領域の切出し対象文字
として東京を記入し、そして都が印刷されている属性判
別領域にチェックを付すこととなる。また都が印刷され
た属性判別領域にチェックが付される場合、道が印刷さ
れた属性判別領域にチェックが付される場合、及び、府
が印刷された属性判別領域にチェックが付される場合の
それぞれにおいて、記入される切出し対象文字の総個数
の上限値Gmax 及び下限値Gmin はGmax =Gmin =2
個となる。県が印刷された属性判別領域にチェックが付
される場合においては、切出し対象文字が和歌山、埼玉
或はそのほかの県名であるので、上限値Gmax 及び下限
値Gmin はGmax =3個及びGmin =2個となる。この
ように、属性判別領域の有無と、上限値Gmax 及び下限
値Gmin との間には相関関係が存在し、この相関関係に
基づいて、上限値Gmax 及び下限値Gmin をデータとし
て蓄積しておくことができる。
[0011] For example, it has an entry area in which the name of the prefecture where the entrant lives is entered and four attribute discrimination areas corresponding to the entry area, and the characters of the capital, the road, the prefecture, and the prefecture are individual. Consider a form printed in the attribute determination area. In this case, only one of the four attribute determination areas is checked.
If the resident is a resident of Tokyo, the user enters Tokyo as a character to be cut out of the entry area, and checks the attribute determination area where the capital is printed. When the attribute discrimination area where the capital is printed is checked, the attribute discrimination area where the road is printed is checked, and the attribute discrimination area where the prefecture is printed is checked. In each of the above, the upper limit value G max and the lower limit value G min of the total number of cut-out target characters to be written are G max = G min = 2.
Individual. When the attribute discrimination area in which the prefecture is printed is checked, the character to be extracted is Wakayama, Saitama or another prefecture name, so the upper limit G max and the lower limit G min are G max = 3 And G min = 2. Thus, the presence or absence of attribute discrimination area, there is a correlation between the upper limit value G max and the lower limit value G min, on the basis of this correlation, the upper limit value G max and the lower limit value G min as data Can be stored.

【0012】ここに例示したように、記入される切出し
対象文字の総個数は上限値Gmax 以下であってかつ下限
値Gmin 以上であるので、記入される切出し対象文字の
総個数が、上限値Gmax よりも大きくなることはなくか
つ下限値Gmin よりも小さくなることはない。従って仮
の切出し位置を用いて求めた仮の切出し文字総個数が、
上限値Gmax 及び下限値Gmin の数値範囲内にあるか否
かを判定することによって、当該仮の切出し位置を、対
象パタン切出し位置(切出し対象文字の切出し位置)に
用いることが適切か否かを判定でき、これがため上限値
max 及び下限値Gmin を、切出し許容個数の上限値及
び下限値に用いることができる。
[0012] As illustrated herein, the total number of cut object character to be entered is the upper limit value G max or less was it and the lower limit value G min or more, the total number of cut object character to be entered is, the upper limit It does not become larger than the value Gmax and does not become smaller than the lower limit Gmin . Therefore, the total number of temporary cut characters obtained using the temporary cut position is
Whether by determining whether it is within the numerical range of the upper limit value G max and the lower limit value G min, the cropping position of the temporary target pattern or extraction position (cut target character extraction position) for use is properly or it can be determined, which the upper limit value G max and the lower limit value G min, it is possible to use the upper and lower limits of the cut-out tolerance number.

【0013】さらに属性判別領域の周辺分布は、当該領
域にチェックを付した状態では大きな値となり、当該領
域にチェックを付していない状態では小さな値となるの
で、このチェックの有無に応じて周辺分布が変化するこ
とを利用することにより、属性判別領域の有無を検出で
きる。従って属性判別領域のチェックの有無を検出し、
当該検出結果に対応した切出し許容個数の上限値及び下
限値を、前述のデータとして蓄積してある上限値Gmax
及び下限値Gmin のなかから、選択し設定できる。
Further, the peripheral distribution of the attribute determination area has a large value when the area is checked, and has a small value when the area is not checked. By utilizing the fact that the distribution changes, the presence or absence of the attribute determination area can be detected. Therefore, the presence or absence of the check of the attribute determination area is detected,
The upper limit value and the lower limit value of the cutout allowable number corresponding to the detection result are stored in the upper limit value G max stored as the above-described data.
And the lower limit Gmin .

【0014】[0014]

【実施例】以下、図面を参照し、この発明の実施例につ
いて説明する。尚、図面は発明が理解できる程度に概略
的に示してあるにすぎず、従って発明を図示例に限定す
るものではない。
Embodiments of the present invention will be described below with reference to the drawings. The drawings are only schematically shown to the extent that the invention can be understood, and thus the invention is not limited to the illustrated examples.

【0015】図1はこの発明の実施例の全体構成を概略
的に示す機能ブロック図である。同図に示すこの実施例
の文字切出し装置10は、画像記憶手段12、フォーマ
ット記憶手段14、切出し許容数設定手段16、切出し
位置決定手段18及びパタン読出し手段20を備える。
FIG. 1 is a functional block diagram schematically showing an entire configuration of an embodiment of the present invention. The character extracting apparatus 10 of this embodiment shown in FIG. 1 includes an image storage unit 12, a format storage unit 14, an allowable number of extraction units setting unit 16, an extraction position determination unit 18, and a pattern reading unit 20.

【0016】画像記憶手段12は、切出し対象文字が記
入される記入領域と当該記入領域に対応する属性判別領
域とを有する帳票の画像パタンを格納する。帳票の記入
者は、伝達したい情報を記入領域の切出し対象文字によ
って表し、当該伝達情報の属性を属性判別領域のチェッ
クの有無によって表す。
The image storage means 12 stores an image pattern of a form having an entry area in which a character to be extracted is entered and an attribute determination area corresponding to the entry area. The person who fills out the form indicates the information to be transmitted by the character to be cut out of the entry area, and the attribute of the transmission information by the presence or absence of the check of the attribute determination area.

【0017】フォーマット記憶手段14は、少なくと
も、記入領域の画像パタンを格納した領域のアドレスと
属性判別領域の画像パタンを格納した領域のアドレスと
を、フォーマット情報として格納する。
The format storage means 14 stores at least the address of the area storing the image pattern of the entry area and the address of the area storing the image pattern of the attribute determination area as format information.

【0018】切出し許容数設定手段16は、属性判別領
域の画像パタンを走査して周辺分布を作成し、この属性
判別領域の周辺分布を用いて属性判別領域のチェックの
有無を検出し、当該検出結果に対応した切出し許容個数
の上限値及び下限値を設定する。
The cutout allowable number setting means 16 scans the image pattern of the attribute discrimination area to create a peripheral distribution, detects whether or not the attribute discrimination area is checked using the peripheral distribution of the attribute discrimination area, and performs the detection. The upper limit and the lower limit of the allowable number of cutouts corresponding to the result are set.

【0019】切出し位置決定手段18は、記入領域の画
像パタンから文字要素パタンを検出し、この文字要素パ
タンの検出位置を用いて仮の切出し位置を設定する。さ
らに切出し位置決定手段18は、仮の切出し位置を用い
て記入領域の仮の切出し文字総個数を求め、そして仮の
切出し文字総個数が、切出し許容個数の上限値よりも大
きいとき及び切出し許容個数の下限値よりも小さいとき
は、仮の切出し位置を補正すると共に当該補正位置を用
いて仮の切出し文字総個数を求め直し、また仮の切出し
文字総個数が、切出し許容個数の上限値以下であってか
つ切出し許容個数の下限値以上となったとき、当該仮の
切出し文字総個数を得た仮の切出し位置を、対象パタン
切出し位置として決定する。
The cutout position determining means 18 detects a character element pattern from the image pattern of the entry area, and sets a temporary cutout position using the detected position of the character element pattern. Further, the cut-out position determining means 18 calculates the provisional cut-out character total number in the entry area using the provisional cut-out position, and when the provisional cut-out character total number is larger than the upper limit of the cut-out allowable number and the cut-out allowable number. Is smaller than the lower limit value, the provisional clipping position is corrected, and the total number of provisional clipping characters is calculated again using the correction position. When the number of cut-out characters exceeds the lower limit of the cut-out allowable number, the tentative cut-out position at which the tentative cut-out character total number is obtained is determined as the target pattern cut-out position.

【0020】パタン切出し手段20は、対象パタン切出
し位置を用いて切出し対象文字パタンを切り出す。
The pattern extracting means 20 extracts a character pattern to be extracted using the target pattern extracting position.

【0021】(帳票)図2はこの実施例で用いる帳票の
一例を示す。この実施例では、帳票22は、帳票記入者
の伝達情報として住所を記入するようにした帳票の例で
あって、この帳票22は、都、道、府或は県の名称を記
入する記入領域241及び当該領域に対応する4個の属
性判別領域261と、区、市或は郡の名称を記入する記
入領域242及び当該領域に対応する3個の属性判別領
域262と、区、町或は村の名称を記入する記入領域2
43及び当該領域に対応する3個の属性判別領域263
とを有する。図中、これら記入領域241、242、2
43及び属性判別領域261、262、263の位置を
一点鎖線で表したが、この一点鎖線は帳票22には印刷
されていない。
(Form) FIG. 2 shows an example of a form used in this embodiment. In this embodiment, the form 22 is an example of a form in which an address is entered as information transmitted to a form writer, and the form 22 has an entry area for entering the name of a city, a road, a prefecture, or a prefecture. 241 and four attribute determination areas 261 corresponding to the area, an entry area 242 for entering the name of a ward, a city or a county, and three attribute determination areas 262 corresponding to the area, a ward, a town or Entry area 2 for entering the name of the village
43 and three attribute determination areas 263 corresponding to the area
And In the figure, these entry areas 241, 242, 2
The positions of the reference numeral 43 and the attribute determination areas 261, 262, 263 are indicated by dashed lines, but the dashed lines are not printed on the form 22.

【0022】一方、帳票22には、住所記入欄を表す線
ここでは実線28と、住所記入欄のなかを区分する線こ
こでは点線30と、ご住所欄という項目名称とを印刷し
てある。
On the other hand, the form 22 is printed with a line representing an address entry column, here a solid line 28, a line dividing the address entry column, here a dotted line 30, and an item name of an address column.

【0023】記入領域241、属性判別領域261、記
入領域242、属性判別領域262、記入領域243及
び属性判別領域263を、文字列方向Xに沿って順次に
配列し、これら領域241、242、243、261、
262、263を、実線28で囲む。そして相隣合う記
入領域241、242の間を点線30で区切ると共に、
相隣合う記入領域242、243の間を他の点線30で
区切る。
The writing area 241, the attribute determining area 261, the writing area 242, the attribute determining area 262, the writing area 243, and the attribute determining area 263 are sequentially arranged along the character string direction X, and these areas 241, 242, 243 are arranged. 261
262 and 263 are surrounded by a solid line 28. Then, a space between adjacent entry areas 241 and 242 is separated by a dotted line 30, and
The adjacent writing areas 242 and 243 are separated by another dotted line 30.

【0024】さらに帳票22には、記入領域241の各
属性判別領域261内にそれぞれ属性判別用文字321
を印刷してある。ここでは、各属性判別領域261にそ
れぞれ異なる種類の属性判別用文字321を印刷してお
り、これら属性判別用文字321を、都、道、府及び県
の4種としている。属性判別領域261は、当該領域2
61内に印刷された属性判別用文字321周辺の余白領
域を含む。
Further, the form 22 has an attribute determining character 321 in each attribute determining area 261 of the entry area 241.
Is printed. Here, different types of attribute determination characters 321 are printed on the respective attribute determination regions 261, and these four types of attribute determination characters 321 are a city, a road, a prefecture, and a prefecture. The attribute determination area 261 is the area 2
61 includes a margin area around the attribute discrimination character 321 printed.

【0025】同様にして、記入領域242の各属性判別
領域262内にそれぞれ属性判別用文字322を印刷し
てある。ここでは、各属性判別領域262にそれぞれ異
なる種類の属性判別用文字322を印刷しており、これ
ら属性判別用文字322を区、市及び郡の3種としてい
る。属性判別領域262は、当該領域262内に印刷さ
れた属性判別用文字322周辺の余白領域を含む。
Similarly, an attribute determination character 322 is printed in each attribute determination area 262 of the entry area 242. Here, different types of attribute determination characters 322 are printed in the respective attribute determination regions 262, and these three types of attribute determination characters 322 are ward, city, and county. The attribute determination area 262 includes a margin area around the attribute determination character 322 printed in the area 262.

【0026】また記入領域243の各属性判別領域26
3内にそれぞれ属性判別用文字323を印刷してある。
ここでは、各属性判別領域263にそれぞれ異なる種類
の属性判別用文字323を印刷しており、これら属性判
別用文字323を区、町及び村の3種としている。属性
判別領域263は、当該領域263内に印刷された属性
判別用文字323周辺の余白領域を含む。
Each attribute discrimination area 26 of the entry area 243
3, the character 323 for attribute determination is printed.
Here, different types of attribute determination characters 323 are printed in the respective attribute determination regions 263, and these three types of attribute determination characters 323 are ward, town, and village. The attribute determination area 263 includes a margin area around the attribute determination character 323 printed in the area 263.

【0027】帳票22の記入者は、その住所に応じて、
都、道、府或は県の名称を表す切出し対象文字341を
記入領域241に記入し、当該対象文字341に対応す
る属性判別用文字321が印刷された属性判別領域26
1に、チェック361を記入する。同様にして、区、市
或は郡の名称を表す切出し対象文字342を記入領域2
42に記入し、当該対象文字342に対応する属性判別
用文字322が印刷された属性判別領域262に、チェ
ック362を記入する。さらに区、町或は村の名称を表
す切出し対象文字343を記入領域243に記入し、当
該対象文字343に対応する属性判別用文字323が印
刷された属性判別領域263に、チェック363を記入
する。
The person who fills out the form 22 according to the address,
An extraction target character 341 representing the name of a city, a road, a prefecture or a prefecture is entered in the entry area 241, and the attribute determination character 321 corresponding to the target character 341 is printed on the attribute determination area 26.
A check 361 is entered in 1. Similarly, the extraction target character 342 representing the name of a ward, a city or a county is entered in the entry area 2.
42, and a check 362 is entered in the attribute determination area 262 in which the attribute determination character 322 corresponding to the target character 342 is printed. Further, a cut-out target character 343 representing the name of a ward, a town, or a village is entered in the entry area 243, and a check 363 is entered in the attribute determination area 263 on which the attribute determination character 323 corresponding to the target character 343 is printed. .

【0028】例えば図示例では、切出し対象文字341
として都の名称を表す東京の2文字、切出し対象文字3
42として市の名称を表すXXの2文字、切出し対象文
字343として町の名称を表す△△△の3文字、チェッ
ク361〜363として〇を記入している。
For example, in the illustrated example, the character 341 to be cut out
2 characters of Tokyo representing the name of the city, 3 characters to be extracted
42, two characters XX representing the name of the city, three characters 切 representing the name of the town as the extraction target character 343, and 町 as the checks 361-363.

【0029】(画像記憶手段)この実施例では、画像記
憶手段12は、帳票22の画像パタンをスキャナ38か
ら入力し、当該入力パタンを格納(記憶)する。
(Image Storage Means) In this embodiment, the image storage means 12 inputs the image pattern of the form 22 from the scanner 38 and stores (stores) the input pattern.

【0030】スキャナ38は帳票22を光学的に走査し
て、帳票22からの光信号を、画素単位に量子化された
電気信号に変換する。そしてスキャナ38はこの電気信
号を帳票22の画像パタンとして画像記憶手段12に記
憶する。ここでは、画像パタンは、文字又は文字背景を
表す2値の電気信号である。
The scanner 38 optically scans the form 22 and converts an optical signal from the form 22 into an electric signal quantized in pixel units. Then, the scanner 38 stores the electric signal in the image storage unit 12 as an image pattern of the form 22. Here, the image pattern is a binary electric signal representing a character or a character background.

【0031】図3は帳票の画像パタンの説明に供する図
である。図にあっては、帳票22の画像パタン40を二
点鎖線で囲んで示し、この画像パタン40のうち、文字
を表す画像パタンを黒色で及び文字背景を表す画像パタ
ンを白色で表している。
FIG. 3 is a diagram for explaining the image pattern of a form. In the figure, an image pattern 40 of the form 22 is shown by being surrounded by a two-dot chain line, and among the image patterns 40, an image pattern representing a character is represented in black and an image pattern representing a character background is represented in white.

【0032】ここでは、帳票22の実線28と点線30
とご住所欄という項目名称とを、スキャナ38による読
取り不能な色(ドロップアウトカラー)例えば赤色で印
刷してあり、従ってこれら実線28、点線30及び項目
名称の光信号は文字背景を表す画像パタン40に変換さ
れる。
Here, the solid line 28 and the dotted line 30 of the form 22
The item name of the address column is printed in a color (dropout color) that cannot be read by the scanner 38, for example, red. Therefore, the solid line 28, the dotted line 30, and the light signal of the item name are image patterns representing a character background. Converted to 40.

【0033】また属性判別用文字321〜323を、ス
キャナ38による読取り可能な色例えば黒色で印刷する
と共に、切出し対象文字341〜343及びチェック3
61〜363をスキャナ38による読取り可能な色例え
ば黒色で記入してあり、従ってこれら文字321〜32
3、341〜343及びチェック361〜363の光信
号は文字を表す画像パタン40に変換される。
The attributes determining characters 321 to 323 are printed in a color readable by the scanner 38, for example, black, and the characters 341 to 343 to be extracted and the check 3
61 to 363 are written in a color readable by the scanner 38, for example, black.
The optical signals of 3, 341 to 343 and checks 361 to 363 are converted into image patterns 40 representing characters.

【0034】画像記憶手段12の格納領域上には、仮想
的に、X−Y座標系を設定してあり、これら座標位置X
及びYで表される画素位置の画像パタン44を、読み出
すことができるように、画像記憶手段12を構成してい
る。そして帳票22の文字列方向XがX軸方向と平行と
なるように、画像パタン44を格納している。
An XY coordinate system is virtually set on the storage area of the image storage means 12, and these coordinate positions X
The image storage means 12 is configured so that the image pattern 44 at the pixel position represented by Y and Y can be read. The image pattern 44 is stored such that the character string direction X of the form 22 is parallel to the X-axis direction.

【0035】例えば、スキャナ38の主走査方向を帳票
22の文字列方向Xとほぼ平行となるように、帳票22
をスキャナ38にセッティングして、帳票22を光学的
に走査することにより、文字列方向XがX軸方向と平行
となるように画像パタン44を格納する。
For example, the form 22 is set so that the main scanning direction of the scanner 38 is substantially parallel to the character string direction X of the form 22.
Is set on the scanner 38, and the form 22 is optically scanned to store the image pattern 44 so that the character string direction X is parallel to the X-axis direction.

【0036】(フォーマット記憶手段)この実施例で
は、フォーマット記憶手段14は、記入領域241、2
42、243の画像パタン40をそれぞれ各領域毎に個
別に画像記憶手段12から読み出すためのアドレスと、
属性判別領域261、262、263の画像パタン40
をそれぞれ各領域毎に個別に画像記憶手段12から読み
出すためのアドレスとを記憶する。ここでは、これらア
ドレスを、画像記憶手段12の格納領域上に設定した座
標位置X、Yで表す(以下、このアドレスをアドレス
X、Yと表す)。
(Format storage means) In this embodiment, the format storage means 14 stores the entry areas 241, 2
Addresses for individually reading out the image patterns 40 of 42 and 243 from the image storage means 12 for each area;
Image pattern 40 of attribute determination areas 261, 262, 263
And an address for reading from the image storage unit 12 for each area. Here, these addresses are represented by coordinate positions X and Y set on the storage area of the image storage unit 12 (hereinafter, these addresses are represented as addresses X and Y).

【0037】さらにフォーマット記憶手段14は、属性
判別領域261、262、263の周辺分布を正規化す
るための定数An と、文字要素パタンを検出するための
閾値THL1とを記憶する。
Furthermore format storage unit 14 stores the constants A n for normalizing the marginal distribution of the attribute discrimination region 261, 262, 263, and a threshold value THL1 for detecting a character element pattern.

【0038】(切出し許容数設定手段)この実施例で
は、切出し許容数設定手段16は、周辺分布作成手段1
6a、チェック領域検出手段16b及び許容数記憶手段
16cを有する。
(Allowable Extraction Number Setting Means) In this embodiment, the allowable extraction number setting means 16 includes the margin distribution creation means 1.
6a, a check area detecting means 16b and an allowable number storing means 16c.

【0039】周辺分布作成手段16aは、各属性判別領
域毎に個別に周辺分布を作成し、各周辺分布を正規化す
る。
The margin distribution creating means 16a creates margin distributions individually for each attribute discrimination area, and normalizes each margin distribution.

【0040】チェック領域検出手段16bは、各記入領
域毎に、正規化した周辺分布のなかで最大となる周辺分
布を検出し、正規化した周辺分布が最大となる属性判別
領域を、当該判別領域に対応した記入領域に関しチェッ
クが付された属性判別領域として検出する。各記入領域
毎に、正規化した周辺分布が最大となる属性判別領域
を、チェックが付された属性判別領域(チェック有りの
属性判別領域)と判定すると共に正規化した周辺分布が
最大とならない属性判別領域を、チェックが付されてい
ない属性判別領域(チェック無しの属性判別領域)と判
定する。そしてチェック領域検出手段16bは、各記入
領域毎に、チェックの有無に対応する切出し許容数の上
限値Gmax 及びGmin を設定する。
The check area detecting means 16b detects, for each entry area, the peripheral distribution which is the largest among the normalized peripheral distributions, and determines the attribute discriminating area where the normalized peripheral distribution is the largest. Is detected as an attribute discrimination area with a check for the entry area corresponding to. For each entry area, the attribute discrimination area in which the normalized peripheral distribution is the largest is determined as a checked attribute discrimination area (the checked attribute discrimination area), and the attribute in which the normalized peripheral distribution is not the largest. The determination area is determined as an attribute determination area that is not checked (an attribute determination area without a check). Then, the check area detecting means 16b sets the upper limit values G max and G min of the cutout allowable number corresponding to the presence or absence of the check for each entry area.

【0041】許容数記憶手段16cは、各記入領域毎
に、チェックの有無の検出結果に対応した切出し許容数
の上限値Gmax 及び下限値Gmin を記憶しており、チェ
ック領域検出手段16bは、チェックの有無に対応した
上限値Gmax 及び下限値Gminを、許容数記憶手段1
6cから読み出す。
The permissible number storage means 16c stores the upper limit value G max and the lower limit value G min of the permissible number of cutouts corresponding to the detection result of the check for each entry area. , The upper limit G max and the lower limit G min corresponding to the presence or absence of the check,
6c.

【0042】チェックの有無の検出について、一例を挙
げて、より具体的に説明する。ここでは、属性判別領域
263に着目して説明する。図4及び図5はその説明に
供する図である。図4及び図5の分図(A)はチェック
無し及びチェック有りの場合における属性判別領域26
3の画像パタンを表す図であって、これら図にあっては
図3と同様にして文字及び文字背景を表す画像パタンを
示してある。また図4及び図5の分図(B)はチェック
無し及びチェック有りの場合における属性判別領域26
3の周辺分布を示す図であって、これら図にあっては横
軸に副走査位置Y及び縦軸に累積文字画素数f(Y)
を取って示してある。
The detection of the presence / absence of the check will be described more specifically with an example. Here, the description will focus on the attribute determination area 263. 4 and 5 are diagrams for explanation. FIGS. 4A and 4B show the attribute discrimination area 26 when there is no check and when there is a check.
3A and 3B are diagrams showing image patterns, and in these figures, image patterns showing characters and character backgrounds are shown in the same manner as in FIG. 3. FIGS. 4 and 5 show the attribute discrimination area 26 when there is no check and when there is a check.
3 is a diagram showing the peripheral distribution of No. 3 in which the horizontal axis represents the sub-scanning position Y and the vertical axis represents the cumulative number of character pixels f n (Y)
Is shown.

【0043】この実施例の帳票22にあっては、記入領
域243に対し3個の属性判別領域263を設定してお
り、属性判別用文字323として区、町及び村がそれぞ
れ異なる属性判別領域263内に印刷してある。ここで
は、区、町及び村が印刷されている属性判別領域263
をそれぞれ、第1番目、第2番目及び第3番目の属性判
別領域263とする。
In the form 22 of this embodiment, three attribute discrimination areas 263 are set for the entry area 243, and the attribute discrimination areas 263 having different wards, towns and villages are used as the attribute discrimination characters 323. Printed inside. Here, the attribute determination area 263 on which the ward, town, and village are printed
Are the first, second, and third attribute determination areas 263, respectively.

【0044】そして文字列方向Xにおける属性判別領域
263の始端及び終端の位置をXL及びXR 、また文字
列方向Xと交差する方向Yにおける属性判別領域263
の始端及び終端の位置をYT 及びYB と表せば、第1番
目の属性判別領域263にあっては、XL =X1、XR
=X2、YT =Y1及びYB =Y2とし、X1≦X≦X
2かつY1≦Y≦Y2なる範囲を、第1番目の属性判別
領域263の画像パタン40を読み出すためのアドレス
X、Yとする。また第2番目の属性判別領域263にあ
っては、XL =X1、XR =X2、YT =Y2及びYB
=Y3とし、X1≦X≦X2かつY2≦Y≦Y3なる範
囲を、第2番目の属性判別領域263の画像パタン40
を読み出すためのアドレスX、Yとする。さらに第3番
目の属性判別領域263にあっては、XL =X1、XR
=X2、YT =Y3及びYB =Y4とし、X1≦X≦X
2かつY3≦Y≦Y4なる範囲を、第3番目の属性判別
領域263の画像パタン40を読み出すためのアドレス
X、Yとしている。
The start and end positions of the attribute discrimination area 263 in the character string direction X are X L and X R , and the attribute discrimination area 263 in the direction Y intersecting the character string direction X.
Expressed in the position of the start and end with Y T and Y B, In the first-th attribute discrimination region 263, X L = X1, X R
= X2, and Y T = Y1 and Y B = Y2, X1 ≦ X ≦ X
The range of 2 and Y1 ≦ Y ≦ Y2 is defined as addresses X and Y for reading the image pattern 40 in the first attribute determination area 263. Also In the first second attribute determination area 263, X L = X1, X R = X2, Y T = Y2 and Y B
= Y3, and the range of X1 ≦ X ≦ X2 and Y2 ≦ Y ≦ Y3 is defined as the image pattern 40 of the second attribute determination area 263.
Are the addresses X and Y for reading out the data. Further, in the third attribute determination area 263, X L = X1, X R
= X2, Y T = Y3 and Y B = Y4, and X1 ≦ X ≦ X
The range of 2 and Y3 ≦ Y ≦ Y4 is defined as addresses X and Y for reading the image pattern 40 in the third attribute determination area 263.

【0045】まず、周辺分布作成手段16aは、第n番
目(nはn≧1なる自然数であって、ここではn=1、
2、3)の属性判別領域263のアドレスX、Yをフォ
ーマット記憶手段14から読み出し、そして当該アドレ
スX、Yに対応する属性判別領域263の画像パタン4
0を、画像記憶手段12から読み出す。
First, the marginal distribution creating means 16a determines the n-th (n is a natural number satisfying n ≧ 1; here, n = 1,
The addresses X and Y of the attribute determination area 263 of (2) and (3) are read from the format storage unit 14, and the image pattern 4 of the attribute determination area 263 corresponding to the addresses X and Y is read.
0 is read from the image storage unit 12.

【0046】次いで周辺分布作成手段16aは、主走査
方向を文字列方向X及び副走査方向を文字列方向Xと交
差する方向Yとして、第n番目の属性判別領域263の
画像パタン40を走査し、各副走査位置Y毎に、走査線
上の累積文字画素数fn(Y) を求める。累積文字画素数fn
(Y) は、副走査位置Yの走査線上に存在しかつ第n番目
の属性判別領域263内に存在する文字画素の総個数で
ある。
Next, the peripheral distribution creating means 16a scans the image pattern 40 in the n-th attribute discrimination area 263 with the main scanning direction as the character string direction X and the sub-scanning direction as the direction Y intersecting with the character string direction X. , The cumulative number of character pixels f n (Y) on the scanning line is determined for each sub-scanning position Y. Cumulative character pixel number f n
(Y) is the total number of character pixels existing on the scanning line at the sub-scanning position Y and existing in the n-th attribute determination area 263.

【0047】次いで周辺分布作成手段16aは第n番目
の属性判別領域263の周辺分布∫fn(Y) dYを求める。
周辺分布∫fn(Y) dYは、第n番目の属性判別領域263
の始端位置YT から終端位置YB までの累積文字画素数
fn(Y) の総和である。
Next, the peripheral distribution creating means 16a obtains a peripheral distribution Δf n (Y) dY of the n-th attribute discrimination area 263.
The marginal distribution ∫f n (Y) dY is the n-th attribute determination area 263
Number of character pixels from the start position Y T to the end position Y B
It is the sum of f n (Y).

【0048】次いで周辺分布作成手段16aは、第n番
目の属性判別領域263の周辺分布∫fn(Y) dYを正規化
するための定数An を、フォーマット記憶手段14から
読み出し、第n番目の属性判別領域263の周辺分布∫
fn(Y) dYを定数An で正規化することにより、正規化し
た周辺分布1/An・∫fn(Y) dYを求める。
[0048] Then the peripheral distribution creation unit 16a is the constant A n for normalizing the marginal distribution ∫f n (Y) dY of the n-th attribute discrimination region 263, read from the format storage unit 14, the n-th Distribution around the attribute discrimination area 263 of
By normalizing f n (Y) dY with a constant An , a normalized marginal distribution 1 / A n · ∫f n (Y) dY is obtained.

【0049】周辺分布∫fn(Y) dYを正規化するための正
規化定数An は次式(数1)で表される。
The normalization constant A n for normalizing the marginal distribution [integral] F n (Y) dY is represented by the following equation (Equation 1).

【0050】1/An・∫Fn(Y) dY=C・・・・(数1) 但し、∫Fn(Y) dY:チェックを付さない状態で予め求め
た第n番目の属性判別領域の周辺分布∫fn(Y) dY C:正の整数である定数 この実施例の帳票22では属性判別領域263に関して
はn=1、2、3としているので、n=1、2、3とし
て(数1)を書き改めると、次式(数2)の如くなる。
[0050] 1 / A n · ∫F n ( Y) dY = C ···· ( number 1) However, ∫F n (Y) dY: n-th attributes previously obtained with no added check Peripheral distribution ∫f n (Y) dY C of the discrimination area C: a constant that is a positive integer In the form 22 of this embodiment, n = 1, 2, 3 for the attribute discrimination area 263, so that n = 1, 2, Rewriting (Formula 1) as 3 gives the following formula (Formula 2).

【0051】 1/A1・∫F1(Y) dY=1/A2・∫F2(Y) dY=1/A3・∫F3(Y) dY=C・・(数2) チェック363を付していない状態で各属性判別領域2
63毎に周辺分布∫Fn(Y) dYを得、各周辺分布∫Fn(Y)
dYを定数Cと等しくする正規化定数An を求める。この
ように正規化定数An は、各属性判別領域263毎に個
別に予め求められ、そしてフォーマット記憶手段14に
予め記憶されるものである。
1 / A 1 · ∫F 1 (Y) dY = 1 / A 2 · ∫F 2 (Y) dY = 1 / A 3 · ∫F 3 (Y) dY = C (Equation 2) Check Each attribute discriminating area 2 without 363
The marginal distribution ∫F n (Y) dY is obtained for each 63, and each marginal distribution ∫F n (Y)
A normalization constant An that makes dY equal to the constant C is obtained. As described above, the normalization constant An is individually obtained in advance for each attribute determination area 263, and is stored in the format storage unit 14 in advance.

【0052】次にチェック領域検出手段16bは、各属
性判別領域263毎に求めた正規化周辺分布1/An・∫fn
(Y) dYのなかから、最大の正規化周辺分布1/An・∫f
n(Y) dYを検出する。そしてチェック領域検出手段16
bは、正規化周辺分布1/An・∫fn(Y) dYが最大となる属
性判別領域263を、当該判別領域263に対応する記
入領域243に関し、チェック363が付されている属
性判別領域263として検出する。
Next, the check area detecting means 16b calculates the normalized marginal distribution 1 / A n · ∫f n obtained for each attribute discrimination area 263.
(Y) From dY, the largest normalized marginal distribution 1 / A n
n (Y) dY is detected. Then, the check area detecting means 16
b indicates the attribute discrimination area 263 in which the normalized marginal distribution 1 / A n · ∫f n (Y) dY is the maximum, and the attribute discrimination area 243 corresponding to the discrimination area 263 is marked with a check 363. It is detected as an area 263.

【0053】この実施例で用いる帳票22にあっては、
記入領域243に対して設けた複数の属性判別領域26
3のいずれかひとつに、チェック363を付す。これが
ため当該記入領域243に関して、正規化周辺分布1/An
・∫fn(Y) dYが最大となる属性判別領域263を、チェ
ック363が付された属性判別領域(チェック有りの属
性判別領域)263として検出し、かつ、正規化周辺分
布1/An・∫fn(Y) dYが最大とならない属性判別領域26
3を、チェック263が付されていない属性判別領域
(チェック無しの属性判別領域)263として検出する
ことができる。
In the form 22 used in this embodiment,
A plurality of attribute determination areas 26 provided for the entry area 243
A check 363 is attached to any one of the three. Therefore, with respect to the entry area 243, the normalized marginal distribution 1 / A n
∫f n (Y) The attribute discrimination area 263 having the maximum dY is detected as the attribute discrimination area 263 with the check 363 (the attribute discrimination area with the check) 263, and the normalized marginal distribution 1 / A n・ ∫f n (Y) Attribute discrimination area 26 where dY is not maximum
3 can be detected as an attribute determination area 263 to which no check 263 is attached (an attribute determination area without a check) 263.

【0054】このように正規化した周辺分布1/An・∫fn
(Y) dYが最大となるか否かによって、記入領域243に
対応する各属性判別領域263に関し、チェック363
の有無を検出できる。
The marginal distribution 1 / A n · ∫f n thus normalized
(Y) A check 363 is performed for each attribute determination area 263 corresponding to the entry area 243 depending on whether or not dY is the maximum.
Can be detected.

【0055】またこの実施例では、周辺分布∫fn(Y) dY
を正規化し、そして正規化した周辺分布1/An・∫fn(Y)
dYが最大となる属性判別領域263を、チェック263
が付されている属性判別領域263と判定する。
In this embodiment, the marginal distribution ∫f n (Y) dY
And the normalized marginal distribution 1 / A n・ ∫f n (Y)
The attribute determination area 263 where dY is the maximum is checked 263
Is determined to be the attribute determination area 263 marked with.

【0056】このように正規化した周辺分布1/An・∫fn
(Y) dYを用いるので、属性判別用文字323を構成する
文字画素の総個数が各属性判別領域263毎に相違する
場合でも、またチェック363が当該チェック363を
付すべき属性判別領域263からはみ出て隣接する他の
属性判別領域263内に記入されてしまった場合でも、
精度良く、属性判別領域263のチェック363の有無
を検出できる。
The marginal distribution 1 / A n · ∫f n thus normalized
(Y) Since dY is used, even when the total number of character pixels constituting the attribute determination character 323 is different for each attribute determination area 263, the check 363 protrudes from the attribute determination area 263 to which the check 363 should be attached. Even if it is written in another attribute determination area 263 adjacent to the
The presence or absence of the check 363 in the attribute determination area 263 can be detected with high accuracy.

【0057】同様に記入領域241に関しても、記入領
域241に対して設けられた各属性判別領域261毎に
個別に、周辺分布∫fn(Y) dYを作成しそして正規化した
周辺分布1/An・∫fn(Y) dYを求め、正規化した周辺分布
1/An・∫fn(Y) dYが最大となる属性判別領域261を、
当該判別領域261に対応する記入領域241に関しチ
ェック361が付された属性判別領域261として検出
する。属性判別領域261の正規化した周辺分布1/An
∫fn(Y) dYが最大となるか否かにより、チェック361
の有無を検出できる。
Similarly, for the entry area 241, a marginal distribution ∫f n (Y) dY is created for each attribute discrimination area 261 provided for the entry area 241, and the normalized marginal distribution 1 / A n・ ∫f n (Y) dY is obtained and normalized marginal distribution
1 / A n · ∫f n (Y) dY,
The entry area 241 corresponding to the determination area 261 is detected as an attribute determination area 261 with a check 361 attached. Normalized marginal distribution 1 / A n · of attribute discrimination area 261
Check 361 depending on whether or not ∫f n (Y) dY is maximum
Can be detected.

【0058】さらに記入領域242に関しても、記入領
域242に対して設けられた各属性判別領域262毎に
個別に、周辺分布∫fn(Y) dYを作成しそして正規化した
周辺分布1/An・∫fn(Y) dYを求め、正規化した周辺分布
1/An・∫fn(Y) dYが最大となる属性判別領域262を、
当該判別領域262に対応する記入領域242に関しチ
ェック362が付された属性判別領域262として検出
する。属性判別領域262の正規化した周辺分布1/An
∫fn(Y) dYが最大となるか否かにより、チェック362
の有無を検出できる。
Further, with respect to the entry area 242, a marginal distribution ∫f n (Y) dY is created individually for each attribute determination area 262 provided for the entry area 242, and the normalized marginal distribution 1 / A n・ ∫f n (Y) dY is calculated and normalized marginal distribution
1 / A n · ∫f n (Y) dY,
The entry area 242 corresponding to the determination area 262 is detected as an attribute determination area 262 with a check 362 added. Normalized marginal distribution 1 / A n · of attribute discrimination area 262
Check 362 depending on whether or not ∫f n (Y) dY is maximum.
Can be detected.

【0059】次に切出し許容個数の上限値Gmax 及びG
min の設定について、一例を挙げて、より具体的に説明
する。ここでは、記入領域241に関する切出し許容個
数の上限値Gmax 及びGmin に着目して説明する。
Next, the upper limit values G max and G of the allowable number of cutouts
The setting of min will be described more specifically with an example. Here, description will be given focusing on the upper limit values G max and G min of the allowable number of cutouts regarding the entry area 241.

【0060】この実施例の帳票22を用いる場合、帳票
22の記入者は、都、道、府或は県の名称を表す切出し
対象文字341を記入領域241に記入し、そして当該
名称に対応する属性判別用文字321ここでは都、道、
府或は県が印刷された属性判別領域261にチェック3
61を付すこととなる。
When the form 22 of this embodiment is used, the person who fills in the form 22 writes a cut-out target character 341 representing the name of a city, a road, a prefecture, or a prefecture in the entry area 241 and corresponds to the name. Character 321 for attribute discrimination
Check 3 in the attribute discrimination area 261 where prefecture or prefecture is printed
61 will be attached.

【0061】そこで記入領域241に記入される切出し
対象文字341の総個数(以下、記入文字総個数)の上
限値Gmax 及び下限値Gmin に着目すると、都が印刷さ
れた属性判別領域261にチェック361を付す場合
(以下、チェックの有無の態様1)にあっては、記入領
域241に記入される切出し対象文字341は東京とな
り従って記入文字総個数の上限値Gmax 及び下限値G
min はGmax =Gmin =2個となる。道が印刷された属
性判別領域261にチェック361を付す場合(以下、
チェックの有無の態様2)にあっては、記入領域241
に記入される切出し対象文字341は北海となり従って
記入文字総個数の上限値Gmax 及び下限値Gmin はG
max =Gmin =2個となる。府が印刷された属性判別領
域261にチェック361を付す場合(以下、チェック
の有無の態様3)にあっては、記入領域241に記入さ
れる切出し対象文字341は京都或は大阪となり従って
記入文字総個数の上限値Gmax 及び下限値Gmin はG
max =Gmin =2個となる。さらに県が印刷された属性
判別領域261にチェック361を付す場合(以下、チ
ェックの有無の態様4)にあっては、記入領域241に
記入される切出し対象文字341は和歌山、埼玉或はそ
のほかの県名を表す文字であり、従って記入文字総個数
の上限値Gmax 及び下限値Gmin はGmax =3、Gmin
=2個となる。
Focusing on the upper limit G max and the lower limit G min of the total number of characters to be cut out 341 (hereinafter referred to as the total number of characters) to be written in the writing area 241, In the case where the check 361 is added (hereinafter referred to as “checked presence / absence mode 1”), the cut-out target character 341 written in the writing area 241 is Tokyo, so the upper limit G max and the lower limit G of the total number of characters to be entered are set.
min is G max = G min = 2. When a check 361 is attached to the attribute determination area 261 on which the road is printed (hereinafter, referred to as “check 361”)
In the case 2) with or without the check, the entry area 241
Upper limit value G max and the lower limit value G min of the cut-out object character 341 is entered becomes the North Sea thus fill characters total number in the G
max = Gmin = 2. In the case where the check mark 361 is added to the attribute discrimination area 261 printed by the government office (hereinafter, whether or not there is a check), the cutout target character 341 to be written in the entry area 241 is Kyoto or Osaka, and thus the input character The upper limit G max and the lower limit G min of the total number are G
max = Gmin = 2. Further, in the case where a check 361 is attached to the attribute discrimination area 261 on which the prefecture is printed (hereinafter referred to as the presence / absence of check 4), the cutout target character 341 to be entered in the entry area 241 is Wakayama, Saitama, or another character. It is a character representing a prefecture name. Therefore, the upper limit value G max and the lower limit value G min of the total number of entered characters are G max = 3, G min
= 2.

【0062】このように属性判別領域261のチェック
361の有無と、記入文字総個数の上限値Gmax 及びG
min との間には、予め判明している相関関係が存在す
る。従って各属性判別領域261のチェック361の有
無の各態様毎に、ここでは上述した態様1〜4の各態様
毎に、記入文字総個数の上限値Gmax 及び下限値Gmin
をデータとして蓄積しておくことができる。
As described above, the presence or absence of the check 361 in the attribute determination area 261 and the upper limit values G max and G
There is a correlation that is known in advance between the min and the min . Therefore, the upper limit value G max and the lower limit value G min of the total number of characters to be entered are provided for each aspect of the presence or absence of the check 361 in each attribute determination area 261, here, for each of the aspects 1 to 4 described above.
Can be stored as data.

【0063】そして後述するように切出し対象文字34
1の切出し位置を検出する場合にあっては、仮の切出し
位置を用いて求めた仮の切出し文字総個数Mが、記入文
字総個数の上限値Gmax 及び下限値Gmin の範囲外の値
となるときは、当該仮の切出し位置は切出し対象文字3
41の切出し位置として不適切であると判定できる。ま
た仮の切出し位置を用いて求めた仮の切出し総個数M
が、属性判別領域261のチェック361の有無に対応
した記入文字総個数の上限値Gmax 及び下限値Gmin
範囲内の値となるとき、当該仮の切出し位置は切出し対
象文字341の切出し位置として適切であると判定でき
る。
As will be described later, the character 34 to be cut out
1 In the case of detecting the extraction position, cutout characters total number M of provisional obtained using the extraction position of the provisional, outside the range of values of the upper limit value G max and the lower limit value G min of fill characters total number , The provisional extraction position is the extraction target character 3
It can be determined that the cutout position 41 is inappropriate. Also, the total number of temporary cuts M obtained using the temporary cut positions
Is within the range of the upper limit value G max and the lower limit value G min of the total number of entered characters corresponding to the presence / absence of the check 361 in the attribute determination area 261, the provisional extraction position is the extraction position of the extraction target character 341. Can be determined to be appropriate.

【0064】従って予め判明している相関関係に基づい
て得た記入文字総個数の上限値Gmax 及び下限値Gmin
を、上述した切出し許容数の上限値Gmax 及び下限値G
minとして用いることができる。
Accordingly, the upper limit value G max and the lower limit value G min of the total number of entered characters obtained based on the previously known correlation.
With the upper limit value G max and the lower limit value G of the cutout allowable number described above.
Can be used as min .

【0065】このように予め判明している切出し許容数
の上限値Gmax 及び下限値Gmin を、各チェックの有無
の態様毎に分類して、許容数記憶手段16cに記憶して
おく。
The upper limit value G max and the lower limit value G min of the permissible number of cut-outs that have been determined in advance are classified according to the presence or absence of each check and stored in the permissible number storage means 16c.

【0066】そしてチェック領域検出手段16bは、記
入領域241に関しチェックの有無の検出結果(すなわ
ちチェックの態様)を得ると、当該検出結果に対応した
切出し許容数の上限値Gmax 及び下限値Gmin を、許容
数記憶手段16cから読み出し、読み出した上限値G
max 及び下限値Gmin を、当該記入領域241に関する
切出し許容数の上限値Gmax 及び下限値Gmin として設
定(記憶)する。
When the check area detecting means 16b obtains the detection result of the presence / absence of the check regarding the entry area 241 (that is, the mode of the check), the upper limit value G max and the lower limit value G min of the cutout allowable number corresponding to the detection result. From the allowable number storage means 16c, and the read upper limit G
The max and the lower limit value G min, is set as cut allowed number of upper limit value G max and the lower limit value G min relating to the entry region 241 (storage).

【0067】同様にして、記入領域242に関しても、
予め判明している切出し許容数の上限値Gmax 及び下限
値Gmin を、各チェックの有無の態様毎に分類して、許
容数記憶手段16cに記憶しておく。そしてチェック領
域検出手段16bは、記入領域242に関しチェックの
有無の検出結果(すなわちチェックの態様)を得ると、
当該検出結果に対応した切出し許容数の上限値Gmax
び下限値Gmin を、許容数記憶手段16cから読み出
し、読み出した上限値Gmax 及び下限値Gmin を、当該
記入領域242に関する切出し許容数の上限値Gmax
び下限値Gmin として設定(記憶)する。
Similarly, regarding the entry area 242,
The upper limit value G max and the lower limit value G min of the permissible number of cutouts that have been determined in advance are classified according to each check mode, and stored in the permissible number storage unit 16c. When the check area detection unit 16b obtains the detection result of the presence / absence of the check regarding the entry area 242 (that is, the mode of the check),
The upper limit value G max and the lower limit value G min of cut allowable number corresponding to the detection result, reading from the allowable number storage unit 16c reads the upper limit value G max and the lower limit value G min, cut allowable number relating to the entry region 242 Are set (stored) as the upper limit value Gmax and the lower limit value Gmin .

【0068】また記入領域243に関しても、予め判明
している切出し許容数の上限値Gmax 及び下限値Gmin
を、各チェックの有無の態様毎に分類して、許容数記憶
手段16cに記憶しておく。そしてチェック領域検出手
段16bは、記入領域243に関しチェックの有無の検
出結果(すなわちチェックの態様)を得ると、当該検出
結果に対応した切出し許容数の上限値Gmax 及び下限値
min を、許容数記憶手段16cから読み出し、読み出
した上限値Gmax 及び下限値Gmin を、当該記入領域2
43に関する切出し許容数の上限値Gmax 及び下限値G
min として設定する。
Regarding the entry area 243, the upper limit value G max and the lower limit value G min of the number of permissible cutouts that have been determined in advance are known.
Are classified according to each check mode, and stored in the allowable number storage unit 16c. Then check area detecting unit 16b obtains the detection result of the presence or absence of the check relates entry region 243 (i.e., aspects of the check), the upper limit G max and the lower limit value G min of cut allowable number corresponding to the detection result, the allowable The upper limit value G max and the lower limit value G min read from the number storage unit 16 c are stored in the entry area 2.
Upper limit value G max and lower limit value G of the permissible number of cuts related to 43
Set as min .

【0069】(切出し位置決定手段)この実施例では、
切出し位置決定手段18は、文字要素検出手段18a、
ピッチ推定手段18b、切出しパラメータ記憶手段18
c、終了位置検出手段18d及び位置設定制御手段18
eを有する。
(Cutout Position Determination Means) In this embodiment,
The cutout position determining means 18 includes a character element detecting means 18a,
Pitch estimation means 18b, cut-out parameter storage means 18
c, end position detecting means 18d and position setting controlling means 18
e.

【0070】文字要素検出手段18aは、各記入領域毎
に、文字列方向Xにおける文字要素パタンの始端位置X
L 及び終端位置XR を検出する。文字要素パタンは文字
画素が連結して存在する領域の画像パタンであり、切出
し対象文字の画像パタンすなわち対象文字パタンは1個
又は複数個の文字要素パタンを含む。ここでは1個の記
入領域には、切出し対象文字が一列のみ記入される。
The character element detecting means 18a calculates the start position X of the character element pattern in the character string direction X for each entry area.
Detecting the L and end position X R. The character element pattern is an image pattern of an area in which character pixels are connected, and the image pattern of a character to be extracted, that is, the target character pattern includes one or a plurality of character element patterns. Here, only one line of characters to be cut out is entered in one entry area.

【0071】ピッチ推定手段18bは、文字要素パタン
の始端位置XL 及び終端位置XR を用いて、各記入領域
内において、文字列方向Xにおける文字要素幅WB のう
ち最大の文字要素幅WBmaxと文字列方向Xにおける文字
要素間隔WS のうち最小となる離間間隔WSminとを求
め、各記入領域毎に、最大の幅WBmax及び最小の幅W
Sminの和を推定文字ピッチpの初期値として設定する。
文字要素幅WB は文字要素パタンの幅、文字要素間隔W
S は相隣接する文字要素パタンの離間間隔すなわち相隣
接する文字要素が挟む余白パタンの幅である。余白パタ
ンは文字背景画素が連結して存在する領域の画像パタン
である。
The pitch estimating means 18b uses the start position X L and the end position X R of the character element pattern to set the maximum character element width W B of the character element width W B in the character string direction X in each entry area. Bmax and the minimum spacing W Smin of the character element spacing W S in the character string direction X are obtained, and the maximum width W Bmax and the minimum width W are determined for each entry area.
The sum of Smin is set as the initial value of the estimated character pitch p.
Character element width W B is the character element pattern width, character element interval W
S is the space between adjacent character element patterns, that is, the width of a margin pattern sandwiched between adjacent character elements. The margin pattern is an image pattern of an area in which character background pixels are connected.

【0072】切出しパラメータ記憶手段18cは、文字
要素パタンの始端位置XL 及び終端位置XR と推定文字
ピッチpと仮の切出し開始位置XS 及び仮の切出し終了
位置XE とをそれぞれ、読み出し及び書き換えの自由に
記憶する。
The extraction parameter storage means 18c reads out and reads the start position X L and end position X R of the character element pattern, the estimated character pitch p, the provisional extraction start position X S and the provisional extraction end position X E , respectively. Remember freely for rewriting.

【0073】終了位置検出手段18dは、仮の切出し開
始位置XS から、文字切出し方向へほぼ推定文字ピッチ
pだけ離間した位置を、仮の切出し終了位置XE として
算出する。
The end position detecting means 18d calculates a position separated from the tentative cut-out start position X S by the estimated character pitch p in the character cut-out direction as a tentative cut-out end position X E.

【0074】位置設定制御手段18eは、仮の切出し終
了位置XE から、文字切出し方向へ向けてΔX(ΔXは
正の整数)だけ離間した位置を、次の仮の切出し開始位
置XS として設定する。文字切出し方向を正の方向とす
るときは同一記入領域内に存在する文字要素パタンの始
端位置XL のうち最小の始端位置XL を、最初の仮の切
出し開始位置XS とし、文字切出し方向を負の方向とす
るときは同一記入領域内に存在する文字要素パタンの終
端位置のうち最大の終端位置XR を、最初の仮の切出し
開始位置XS とする。
The position setting control means 18e sets a position separated by ΔX (ΔX is a positive integer) in the character extraction direction from the temporary extraction end position X E as the next temporary extraction start position X S. I do. The minimum starting end position X L of the starting end position X L of the character element pattern existing in the same entry area when the character extraction direction is a positive direction, the cut-out starting position X S of the first formal, character segmentation direction when the negative direction up to the end position X R of the end position of the character element pattern existing in the same entry area, and clipping start position X S of the first formal.

【0075】また位置設定制御手段18eは、終了位置
検出手段18dが算出した仮の切出し終了位置XE が文
字要素領域内の位置となるときは(但しXE =XR とな
るときを除く)仮の切出し終了位置XE を、当該文字要
素領域に隣接する文字要素間領域内の位置若しくは当該
文字要素領域の終端位置XR に補正する。文字要素領域
は文字要素パタンが存在する領域、文字要素間領域は相
隣接する文字要素パタンが挟む領域すなわち余白パタン
が存在する領域である。
[0075] The positioning control unit 18e, when it cut the end position X E of the provisional end position detecting means 18d has calculated the position of the character element region (excluding the case where the where X E = X R) a temporary cut ending position X E, corrects the end position X R position or the character element area of the character element between the region adjacent to the character element region. The character element area is an area where a character element pattern exists, and the area between character elements is an area where adjacent character element patterns are interposed, that is, an area where a margin pattern exists.

【0076】さらに位置設定制御手段18eは、各記入
領域毎に、仮の切出し開始位置XS及び又は仮の切出し
終了位置の検出総個数を記入領域内の切出し文字総個数
Mをとし、そして各記入領域毎に、切出し文字総個数M
と切出し許容個数の上限値G max 及び下限値Gmin との
比較結果に応じて次に述べる1)〜3)の処理を行な
う。
Further, the position setting control means 18 e
For each area, a temporary cutout start position XSAnd / or temporary cutout
The total number of detected end positions is the total number of cutout characters in the entry area
M, and for each entry area, the total number of cutout characters M
And the upper limit G of the allowable number of cutouts max And lower limit Gmin With
The following processes 1) to 3) are performed according to the comparison result.
U.

【0077】処理1);切出し文字総個数Mが切出し許
容個数の下限値Gmin よりも小さいときは、推定文字ピ
ッチpに正の補正値Δpを加算して新たな推定文字ピッ
チpを設定し、この新たな推定文字ピッチpを用いて仮
の切出し開始位置XS 及び仮の切出し終了位置XR を設
定し直すべく、終了位置検出手段18dを再起動する。
[0077] Process 1); when cut characters total number M is smaller than the lower limit value G min of cut allowable number adds a positive correction value Δp sets a new estimated character pitch p of the estimated character pitch p the new by using the estimated character pitch p to reset the cut-out start position X S and cutout end position X R provisional provisional restarting the end position detection means 18d.

【0078】処理2);切出し文字総個数Mが切出し許
容個数の上限値Gmax よりも大きいときは、推定文字ピ
ッチpに負の補正値Δpを加算して新たな推定文字ピッ
チpを設定し、この新たな推定文字ピッチpを用いて仮
の切出し開始位置XS 及び仮の切出し終了位置XR を設
定し直すべく、終了位置検出手段18dを再起動する。
[0078] Process 2); when cut characters total number M is larger than the upper limit value G max of cut allowable number adds a negative correction value Δp of the estimated character pitch p is set to a new estimated character pitch p the new by using the estimated character pitch p to reset the cut-out start position X S and cutout end position X R provisional provisional restarting the end position detection means 18d.

【0079】処理3);切出し文字総個数Mが切出し許
容個数の下限値Gmin 以上かつ切出し許容個数の上限値
max 以下となるとき、当該切出し文字総個数Mを得た
仮の切出し開始位置XS 及び仮の切出し終了位置XE
を、対象パタン切出し位置として決定する。
Process 3); When the total number M of cut-out characters is equal to or more than the lower limit value G min of the allowable number of cut-outs and equal to or less than the upper limit G max of the allowable number of cut-out characters, a temporary cut-out start position at which the total number M of cut-out characters is obtained. X S and temporary cut-out end position X E
Is determined as the target pattern cutout position.

【0080】次に切出し位置決定手段18の動作の流れ
につき、より具体的に一例を挙げて説明する。図6及び
図7はその説明に供する図である。図6は文字要素パタ
ンの検出及び推定文字ピッチの設定の説明に供する図で
あって、図6の分図(A)にあっては記入領域343の
画像パタンを、図3と同様にして示してある。また図6
の分図(B)にあっては横軸に副走査位置X及び縦軸に
副走査位置Xにおける累積文字画素数fn(X) を取って、
記入領域343内の累積文字画素数fn(X) の分布状態を
示してある。図7は位置設定制御手段18eに着目した
動作の流れを示す図である。
Next, the flow of the operation of the cut-out position determining means 18 will be described more specifically by way of an example. 6 and 7 are diagrams for explanation. FIG. 6 is a diagram for explaining the detection of the character element pattern and the setting of the estimated character pitch. In FIG. 6A, the image pattern of the entry area 343 is shown in the same manner as in FIG. It is. FIG.
In the diagram (B), the horizontal axis indicates the sub-scanning position X and the vertical axis indicates the cumulative number of character pixels f n (X) at the sub-scanning position X.
The distribution state of the accumulated character pixel number f n (X) in the entry area 343 is shown. FIG. 7 is a diagram showing the flow of the operation focusing on the position setting control unit 18e.

【0081】まず文字要素検出手段18aは、記入領域
243のアドレスX、Y及び閾値THL1を、フォーマ
ット記憶手段14から読み出し、然る後、記入領域24
1の画像パタン40を、このアドレスX、Yを用いて画
像記憶手段12から読み出す。ここでは、記入領域24
3は、文字列方向Xにおける始端位置XL 及び終端位置
R をXL =X3及びXR =X4、文字列方向Xと直交
する方向Yにおける始端位置YT 及び終端位置YB をY
T =Y5及びYB =Y6とした、XL ≦X≦XR かつY
T ≦Y≦YB の範囲の領域であって、この記入領域24
3のアドレスX、YをXL ≦X≦XR かつYT ≦Y≦Y
B とする。
First, the character element detecting means 18a reads the addresses X and Y of the writing area 243 and the threshold value THL1 from the format storage means 14, and then reads the writing area 24.
One image pattern 40 is read from the image storage unit 12 using the addresses X and Y. Here, the entry area 24
3, the starting end position X L and the end position X R in the character string direction X X L = X3 and X R = X4, the starting end position Y T and end position Y B in the direction Y perpendicular to the character string direction X Y
X L ≦ X ≦ X R and Y, where T = Y5 and Y B = Y6
A region in the range of T ≦ Y ≦ Y B, the entry region 24
3 addresses X, Y and X L ≦ X ≦ X R and Y T ≦ Y ≦ Y
B.

【0082】次いで文字要素検出手段18aは、主走査
方向を文字列方向Xと直交する方向Y及び副走査方向を
文字列方向Xとして、記入領域243の画像パタン40
を走査し、各副走査位置X毎に、走査線上の累積文字画
素数fn(X) を求める。累積文字画素数fn(X) は、副走査
位置Xの走査線上に存在しかつ記入領域243内に存在
する文字画素の総個数である。
Next, the character element detecting means 18a sets the image pattern 40 of the writing area 243 as the direction Y perpendicular to the character string direction X and the sub-scanning direction as the character string direction X.
To obtain the cumulative number of character pixels f n (X) on the scanning line for each sub-scanning position X. The cumulative number of character pixels f n (X) is the total number of character pixels existing on the scanning line at the sub-scanning position X and existing in the writing area 243.

【0083】次いで文字要素検出手段18aは、各副走
査位置X毎に、累積文字画素数fn(X) を閾値THL1と
比較し、fn(X) >THL1となる領域を文字要素領域及
びfn(X) ≦THL1となる領域を文字要素間領域と見做
して、文字要素間領域から文字要素領域に変化したとき
の副走査位置Xを文字要素領域の始端位置XL として及
び文字要素領域から文字要素間領域に変化したときの副
走査位置Xを文字要素領域の終端位置XR として検出す
る。そして文字要素検出手段18aは、記入領域243
内の各文字要素領域毎に、始端位置XL 及び終端位置X
R を切出しパラメータ記憶手段18cに格納する。図6
にあってはTHL1=0とした場合に検出される始端位
置XL 及びXR を示してある。
Next, the character element detecting means 18a compares the cumulative number of character pixels f n (X) with the threshold value THL1 for each sub-scanning position X, and determines the area where f n (X)> THL1 as a character element area and a THL1 area. the f n (X) ≦ THL1 become region regarded as the character elements between the regions, and the sub-scanning position X when the changes from between characters element regions in the character element region and start position X L of the character element regions and character detecting the sub-scanning position X when the change between characters element regions from the element region as a terminal position X R of the character element region. Then, the character element detecting means 18 a
Each character element each area of the inner, starting end position X L and the end position X
R is stored in the extraction parameter storage unit 18c. FIG.
In the is shown a starting position X L and X R is detected when the THL1 = 0.

【0084】次にピッチ推定手段18bは、記入領域2
43内の各文字要素幅WB と記入領域243内の各文字
要素間隔WS とを求める。文字要素幅WB は文字要素領
域の始端位置XL 及び終端位置XR の離間距離に等し
く、文字要素間隔WS は相隣接する文字要素領域の離間
距離に等しい。
Next, the pitch estimating means 18b sets the entry area 2
Request and each character element width W B in 43 and the character element spacing W S in entry region 243. Character element width W B is equal to the distance of the starting position X L and the end position X R of the character elements region, character element spacing W S is equal to the distance between the character element region adjacent phases.

【0085】次いでピッチ推定手段18bは、記入領域
243内の文字要素幅WB のうち最大の幅WBmaxを検出
すると共に、記入領域243内において最大幅WBmax
得た文字要素パタンに隣接する文字要素間隔WS のうち
最小の間隔WSminを検出し、これら最大幅WBmax及び最
小間隔WSminの和を推定文字ピッチpとして求める。そ
してピッチ推定手段18bは、求めた推定文字ピッチp
を切出しパラメータ記憶手段18dに格納する。
Next, the pitch estimating means 18b detects the maximum width W Bmax of the character element widths W B in the writing area 243, and is adjacent to the character element pattern in which the maximum width W Bmax is obtained in the writing area 243. The minimum interval W Smin among the character element intervals W S is detected, and the sum of the maximum width W Bmax and the minimum interval W Smin is obtained as the estimated character pitch p. The pitch estimating means 18b calculates the estimated character pitch p
Is stored in the extraction parameter storage means 18d.

【0086】位置設定制御手段18eは、ピッチ推定手
段18bが推定文字ピッチpを格納し終えると、切出し
パラメータ記憶手段18cから記入領域243の文字要
素領域の始端位置XS を読み出す。そして位置設定制御
手段18eは、記入領域243内の最小の始端位置XS
を検出し、当該最小の始端位置XS を記入領域243の
最初の仮の切出し開始位置XS として切出しパラメータ
記憶手段18cに格納し、然る後、終了位置検出手段1
8dを起動する(図7の開始)。
When the pitch estimating means 18b has stored the estimated character pitch p, the position setting control means 18e reads the starting position X S of the character element area of the writing area 243 from the cut-out parameter storing means 18c. Then, the position setting control unit 18 e determines the minimum start position X S in the entry area 243.
Detects, and stores the cut parameter storage unit 18c the minimum starting end position X S as the first cut-out start position X S of the temporary entry area 243, thereafter, the end position detecting means 1
8d is started (start of FIG. 7).

【0087】起動された終了位置検出手段18dは、切
出しパラメータ記憶手段18cから記入領域243に関
する最初の仮の切出し開始位置XS と推定文字ピッチp
とを読み出し、最初の仮の切出し開始位置XE としてX
S =Xs +p−1を算出する。
The activated end position detecting means 18d stores the first temporary cut start position X S and estimated character pitch p with respect to the entry area 243 from the cut parameter storage means 18c.
Reading the door, X as cut start position X E of the first formal
To calculate the S = X s + p-1 .

【0088】次に位置設定制御手段18eは、終了位置
検出手段18dが算出した仮の切出し終了位置XE が文
字要素領域内の位置及び文字要素間領域内の位置のいず
れであるかを、検定し、この検定結果に応じた仮の切出
し終了位置XE を切出しパラメータ記憶手段18cに格
納する。仮の切出し終了位置XE が文字間領域内の位置
である場合には、当該終了位置XE を補正せずにそのま
ま切出しパラメータ記憶手段18cに格納する。また仮
の切出し終了位置XE が文字領域内の位置である場合に
は、仮の切出し終了位置XE を当該文字領域の終端位置
R 若しくは当該文字領域に隣接する文字間領域内の位
置に補正し、補正した仮の切出し終了位置XE を切出し
パラメータ記憶手段18cに格納する(図7のS1)。
次いで位置設定制御手段18eは、切出し文字総個数M
(Mの初期値はM=0)に1を加算して、切出し文字総
個数Mをカウントする(図7のS2)。
Next, the position setting control means 18e checks whether the provisional cut end position X E calculated by the end position detecting means 18d is a position in the character element area or a position in the inter-character element area. and stores the provisional cut end position X E in accordance with the test result to the cut parameter storage unit 18c. Provisional cut end position X E is the case where the position of the inter-character area stores as it is cut parameter storage unit 18c without correcting the end position X E. In the case the tentative cutout end position X E is the position of a character region, a temporary cut end position X E to the position of the inter-character region adjacent to the end position X R or the character region of the character regions It corrected, cut the corrected temporary cut end position X E are stored in the parameter storage unit 18c (S1 in FIG. 7).
Next, the position setting control unit 18e determines the total number M of cutout characters.
By adding 1 to (the initial value of M is M = 0), the total number M of cut-out characters is counted (S2 in FIG. 7).

【0089】次いで位置設定制御手段18eは、記入領
域243について仮の切出し位置の設定終了したか否か
を判定する(図7のS3)。切出し終了位置XE を記入
領域243内の文字要素領域の終端位置XR のうち最大
の終了位置XRmaxと比較し、XE <XRmaxとなる場合は
設定未終了と判定し、XE ≧XRmaxとなる場合は設定終
了と判定する。
Next, the position setting control unit 18e determines whether the setting of the temporary cutout position has been completed for the entry area 243 (S3 in FIG. 7). Compared with the maximum end position X Rmax of the end position X R of the character element regions of the cutout end position X E in writing area 243, if the X E <X Rmax is determined not ended and configuration, X E ≧ If X Rmax is reached, it is determined that the setting has been completed.

【0090】設定未終了と判定した場合は、位置設定制
御手段18eは、次の仮の切出し開始位置XS としてX
S =XE +ΔXを算出して、次の仮の切出し位置XS
切出しパラメータ記憶手段18cに格納し、然る後、終
了位置検出手段18dを起動する(図7のS4)。例え
ばΔX=1である。起動された終了位置検出手段18d
は、次の仮の切出し開始位置XS を切出しパラメータ記
憶手段18cから読み出し、次の仮の切出し終了位置X
E を算出する。次いで位置設定制御手段18eは、終了
位置検出手段18dが算出した次の仮の切出し終了位置
E の検定及び格納を行なう(図7のS1)。
[0090] When it is determined set not ended and the position setting control section 18e is X as cut start position X S of the next temporary
Calculate the S = X E + ΔX, and stored in the parameter storage unit 18c cuts out the cut position X S of the next temporary, thereafter, starts the end position detecting means 18 d (S4 in FIG. 7). For example, ΔX = 1. Activated end position detecting means 18d
Reads out the next provisional extraction start position X S from the extraction parameter storage unit 18c, and outputs the next provisional extraction end position X S
Calculate E. Then positioning control unit 18e performs test and storage of the cut end position X E of the next provisional end position detecting means 18d is calculated (S1 in FIG. 7).

【0091】また設定終了と判定した場合は、位置設定
制御手段18eは、切出し文字総個数Mを、記入領域2
43に関する切出し許容個数の下限値Gmin 及び上限値
max と比較する(図7のS5)。
If it is determined that the setting has been completed, the position setting control means 18e sets the total number M of cutout characters in the entry area 2
43 relates to comparing the lower limit value G min and an upper limit G max of cut allowable number (S5 in Fig. 7).

【0092】切出し文字総個数Mが下限値Gmin より小
さい場合(M<Gmin なる場合)は位置設定制御手段1
8eは、推定文字ピッチpに負のピッチ補正値Δpを加
算したピッチを新たな推定文字ピッチpとして算出し、
切出しパラメータ記憶手段18cの推定文字ピッチp
を、この新たな推定文字ピッチpに書き換える。然る
後、位置設定制御手段18eは、最初の仮の切出し終了
位置を算出すべく終了位置検出手段18dを起動する
(図7のS6)。起動された終了位置検出手段18d
は、最初の切出し終了位置XE を算出する。然る後、位
置設定制御手段18eは、終了位置検出手段18が算出
した最初の仮の切出し終了位置XE の検定及び格納を行
ない(図7のS1)、以後、切出しパラメータ記憶手段
18cの仮の切出し開始位置XS 及び仮の切出し終了位
置XE を、新たな推定文字ピッチpにより求めた仮の切
出し開始位置XS 及び仮の切出し終了位置XE に書き換
える。
[0092] When cut characters total number M is smaller than the lower limit value G min (M <may become G min) position setting control unit 1
8e calculates a pitch obtained by adding the negative pitch correction value Δp to the estimated character pitch p as a new estimated character pitch p,
Estimated character pitch p of cut-out parameter storage means 18c
To the new estimated character pitch p. Thereafter, the position setting control unit 18e activates the end position detecting unit 18d to calculate the first temporary cutout end position (S6 in FIG. 7). Activated end position detecting means 18d
Calculates a first cut end position X E. Thereafter, positioning control unit 18e performs a test and stored in the first tentative cutout end position X E where the end position detecting means 18 is calculated (S1 in FIG. 7), hereinafter, cutout parameter storage unit 18c tentative rewriting of the cutout start position X S and the temporary cut-out end position X E, the provisional cut start position X S and the temporary cut-out end position X E obtained by the new estimated character pitch p.

【0093】切出し文字総個数Mが上限値Gmax より大
きい場合(M>Gmax なる場合)は、位置設定制御手段
18eは、推定文字ピッチpに正のピッチ補正値Δpを
加算したピッチを新たな推定文字ピッチpとして算出
し、切出しパラメータ記憶手段18cの推定文字ピッチ
pを、この新たな推定文字ピッチpに書き換える。然る
後、位置設定制御手段18eは、最初の仮の切出し終了
位置を算出すべく終了位置検出手段18dを起動する
(図7のS7)。起動された終了位置検出手段18d
は、最初の切出し終了位置XE を算出する。然る後、位
置設定制御手段18eは終了位置検出手段18dが算出
した最初の仮の切出し終了位置XE の検定及び格納を行
ない(図7のS1)、以後、切出しパラメータ記憶手段
18cの仮の切出し開始位置XS 及び仮の切出し終了位
置XE を、新たな推定文字ピッチpにより求めた仮の切
出し開始位置XS 及び仮の切出し終了位置XE に書き換
える。
[0093] cutout characters total number M (if made M> G max) upper limit G if max greater than, positioning control unit 18e newly pitch obtained by adding a positive pitch correction value Δp of the estimated character pitch p The estimated character pitch p is calculated as a new estimated character pitch p, and the estimated character pitch p in the cut-out parameter storage unit 18c is rewritten to the new estimated character pitch p. Thereafter, the position setting control unit 18e activates the end position detecting unit 18d to calculate the first temporary cutout end position (S7 in FIG. 7). Activated end position detecting means 18d
Calculates a first cut end position X E. Thereafter, positioning control unit 18e performs a test and stored in the first tentative cutout end position X E where the end position detecting means 18d is calculated (in FIG. 7 S1), subsequently, the temporary cut-out parameter storage unit 18c the cut start position X S and the temporary cut-out end position X E, rewrites the temporary cut start position X S and the temporary cut-out end position X E obtained by the new estimated character pitch p.

【0094】また切出し文字総個数Mが下限値Gmin
上であって上限値Gmax 以下となる場合(Gmin ≦M≦
max なる場合)は、位置設定制御手段18eは、当該
切出し文字総個数Mを得た各仮の切出し開始位置XS
び各仮の切出し終了位置XEを、記入領域243の対象
パタン切出し位置として決定し、当該記入領域243の
切出し対象パタンを切り出すべくパタン読み出し手段2
0を起動し(図7のS8)、然る後、当該記入領域24
3に関わる対象パタン切出し位置を検出するための処理
を終了する(図7の終了)。
When the total number M of cut-out characters is not less than the lower limit value G min and not more than the upper limit value G max (G min ≦ M ≦
If made G max), the position setting control unit 18e is the cut characters total number clipping start position of each provisional give the M X S and the temporary cut end position X E, the target pattern extraction position of the entry area 243 In order to cut out the pattern to be cut out of the writing area 243.
0 (S8 in FIG. 7), and then the entry area 24
The processing for detecting the target pattern cutout position related to No. 3 is ended (end of FIG. 7).

【0095】同様にして、切出し位置決定手段18は、
他の記入領域241及び242についても、個々の記入
領域毎に、対象パタン切出し位置を検出する。
Similarly, the cut-out position determining means 18
For the other entry areas 241 and 242, the target pattern cutout position is detected for each entry area.

【0096】(パタン読み出し手段)この実施例では、
パタン読み出し手段20は、切出し位置決定手段20に
より起動されると、対象パタン切出し位置の検出を終了
した記入領域に関する対象パタン切出し位置を、切出し
パラメータ記憶手段18cから読み出すと共に、当該記
入領域の始端位置YT 及び終端位置TB をフォーマット
記憶手段14から読み出す。然る後、これら対象パタン
切出し位置と記入領域の始端位置YT 及び終端位置YB
とを用いて、切出し対象パタンを画像記憶手段12から
切り出し、後処理手段40例えば文字認識手段に出力す
る。
(Pattern reading means) In this embodiment,
When activated by the cut-out position determining means 20, the pattern read-out means 20 reads out from the cut-out parameter storage means 18c the target pattern cut-out position relating to the entry area for which the detection of the target pattern cut-out position has been detected, and starts the start position of the entry area. It reads the Y T and the end position T B from the format storage unit 14. Thereafter, starting end position of these target pattern extraction position entry area Y T and end position Y B
By using the above, the extraction target pattern is extracted from the image storage unit 12 and output to the post-processing unit 40, for example, the character recognition unit.

【0097】この実施例では、A)仮の切出し開始位置
S からほぼ推定文字ピッチpだけ離れた位置を仮の切
出し終了位置Xe とし、仮の切出し終了位置XE に隣接
する位置を次の仮の切出し開始位置XS として、順次に
仮の切出し位置XS 、XE を検出し、B)記入領域内の
仮の切出し開始位置XS 又は仮の切出し終了位置X
Eを、切出し文字総個数Mとし、切出し文字総個数Mと
切出し許容数の下限値Gmin 、上限値Gmax とを比較
し、C)この比較結果に応じて、仮の切出し位置XS
E を対象パタン切出し位置として決定し若しくは推定
文字ピッチを補正して再度仮の切出し位置位置XS 、X
E を検出を行なう。
In this embodiment, A) a position substantially apart from the provisional cut-out start position X S by the estimated character pitch p is set as a provisional cut-out end position X e, and a position adjacent to the provisional cut-out end position X E is as cut start position X S provisional of, sequentially tentative extraction position X S, detects X E, B) cut start position of the temporary entry region X S or provisional cutout end position X
Let E be the total number M of cut-out characters, compare the total number M of cut-out characters with the lower limit G min and the upper limit G max of the allowable number of cut-outs, and C) according to the comparison result, the temporary cut-out position X S ,
X E is determined as the target pattern cut-out position or the estimated character pitch is corrected, and the temporary cut-out position X S , X
E is detected.

【0098】このように対象パタン切出し位置を切出し
文字総個数Mと切出し許容数の上限値Gmax 及び下限値
min との比較結果に応じて決定するので、対象パタン
切出し位置の決定を簡単で高精度に行なえる。これがた
め、切出し対象文字パタンの切出し処理を高速化でき、
またこれに加えて装置のハード化に当っては装置構成を
簡単化し装置規模の小型化を図れるという利点がある。
[0098] Since the decision in accordance with the comparison result of the upper limit value G max and the lower limit value G min of the thus cut object pattern extraction position characters total number M and cut allowable number, a simple determination of the target pattern extraction position Can be performed with high precision. Because of this, it is possible to speed up the extraction process of the extraction target character pattern,
In addition to this, there is an advantage that the hardware configuration of the device can be simplified and the size of the device can be reduced.

【0099】図8は帳票の他の例を示す図である。上述
した実施例で用いた帳票22では、属性判別用文字とし
て都道府県等の漢字を用いたが、図8にも示すように属
性判別用文字として、記入領域内に記入される文字の総
個数を表す数字を用いるようにしても良い。例えば図8
の例にあっては、記入者は、記入領域241内に東京都
の3文字が切出し対象文字341として記入する場合、
属性判別用文字361としての3にチェック361を付
す。このように記入領域内に記入される文字の総個数を
表す属性判別用文字を用いる場合でも、上述した実施例
と同様に、対象パタン切出し位置の検出を行なえる。
FIG. 8 is a diagram showing another example of a form. In the form 22 used in the above-described embodiment, the kanji of the prefecture or the like is used as the attribute discrimination character. However, as shown in FIG. 8, the total number of characters to be entered in the entry area is used as the attribute discrimination character. May be used. For example, FIG.
In the example of the above, when the writer enters three characters of Tokyo as the extraction target character 341 in the entry area 241,
A check 361 is added to 3 as the character 361 for attribute determination. As described above, even when the attribute discrimination character representing the total number of characters to be entered in the entry area is used, the target pattern cutout position can be detected.

【0100】この発明は上述した実施例にのみ限定され
るものではなく、この発明の趣旨の範囲内において種々
の変更を行なえる。
The present invention is not limited to the embodiment described above, and various changes can be made within the scope of the present invention.

【0101】例えば、図4及び図5の分図(B)からも
理解できるように、チェック363が付された状態での
個別周辺分布∫fn(Y) dYは、チェック363が付されて
いない状態での個別周辺分布∫fn(Y) dYすなわち周辺分
布∫Fn(Y) dYよりも大きくなる。従って個別周辺分布∫
fn(Y) dYを任意好適に定めた閾値THL2と比較し、そ
の比較結果に応じて属性判別領域263のチェック36
3の有無を検出することもできる。すなわち個別周辺分
布∫fn(Y) dYが閾値THL2以上となる属性判別領域2
63を、チェック363が付された属性判別領域263
として検出し、個別周辺分布∫fn(Y) dYが閾値THL2
未満となる属性判別領域263を、チェック363が付
されていない属性判別領域263として検出すれば良
い。
For example, as can be understood from FIG. 4B and FIG. 5B, the individual marginal distribution Δf n (Y) dY in the state where the check 363 is added is checked 363. The individual marginal distribution ∫f n (Y) dY in the absence state, that is, larger than the marginal distribution ∫F n (Y) dY. Therefore individual marginal distribution ∫
f n (Y) dY is compared with a threshold value THL2 which is arbitrarily determined, and a check 36 of the attribute determination area 263 is performed according to the comparison result.
3 can also be detected. That is, the attribute discrimination area 2 in which the individual marginal distribution ∫f n (Y) dY is equal to or larger than the threshold value THL2.
63 to the attribute determination area 263 with a check 363
And the individual marginal distribution ∫f n (Y) dY is equal to the threshold value THL2.
The attribute discrimination area 263 that is less than may be detected as the attribute discrimination area 263 to which the check 363 is not attached.

【0102】この場合には、閾値THL2(THL
n)を、例えばTHL2n=∫Fn(Y) dY(∫Fn(Y) dYは
チェック363が付されていない状態で得た個別周辺分
布∫fn(Y) dYである)としたり、THL2n=∫Fn(Y) d
Y+α(αは定数)としたりすることができる。
In this case, the threshold value THL2 (THL
2 n ) is, for example, THL2 n = ∫F n (Y) dY (∫F n (Y) dY is the individual marginal distribution ∫f n (Y) dY obtained without the check 363) Or THL2 n = ∫F n (Y) d
Y + α (α is a constant).

【0103】図5にも示すように、チェック363が対
応する属性判別領域261からはみ出ている場合でも、
αを任意好適な大きさの正の整数とすることにより、精
度良く、チェック363の有無を検出できる。
As shown in FIG. 5, even when the check 363 is out of the corresponding attribute discrimination area 261,
By setting α to a positive integer of any suitable size, the presence or absence of the check 363 can be accurately detected.

【0104】またこの場合には、1個の属性判別領域3
63にチェック363が付される場合のみならず複数個
の属性判別領域363にチェック363が付される場合
にも、いずれの属性判別領域263にチェック363が
付されているか検出できる。例えば、帳票22におい
て、区、町及び村に代えて1、2及び3の各数字を属性
判別用文字323に用いる場合を考える。この場合に、
記入領域243に記入した文字の総個数が、属性判別用
文字323のなかから選択した1個と等しい場合には、
当該選択文字323に対応した1個の属性判別領域32
3にチェック363を付し、また記入領域343に記入
した文字の総個数が、属性判別用文字323のなかから
選択した複数個の和と等しい場合には、当該複数の選択
文字323にそれぞれ対応する複数個の属性判別領域3
23にチェック363を付すものとする。例えば、記入
領域243に記入した切出し対象文字343の総個数が
5となる場合には、帳票22の記入者がアラビア数字3
及び2に対応する2個の属性判別領域263にそれぞれ
チェック363を付す。このような場合にも、個別周辺
分布∫fn(Y) dYが閾値THL2以上となる属性判別領域
323を、チェック363が付された属性判別領域32
3として検出することができる。この場合、定数に正の
整数を用いることにより、チェック363の有無を検出
できる。
In this case, one attribute discrimination area 3
When not only the case where the check 363 is given to the 63 but also the case where the check 363 is given to a plurality of attribute determination areas 363, it is possible to detect which attribute determination area 263 is given the check 363. For example, consider a case in which each number 1, 2, and 3 is used as the attribute determination character 323 in the form 22 instead of the ward, town, and village. In this case,
If the total number of characters entered in the entry area 243 is equal to one selected from the attribute determination characters 323,
One attribute determination area 32 corresponding to the selected character 323
3 is checked 363, and when the total number of characters entered in the entry area 343 is equal to the sum of a plurality of characters selected from the attribute discrimination characters 323, each of the plurality of selected characters 323 is corresponded. Attribute determination areas 3
It is assumed that a check 363 is added to 23. For example, when the total number of cutout target characters 343 entered in the entry area 243 is 5, the person who fills the form 22 has the Arabic numeral 3
A check 363 is attached to each of the two attribute discrimination areas 263 corresponding to and. Even in such a case, the attribute discrimination area 323 where the individual marginal distribution ∫f n (Y) dY is equal to or larger than the threshold value THL2 is replaced with the attribute discrimination area 32 with the check 363 attached.
3 can be detected. In this case, the presence or absence of the check 363 can be detected by using a positive integer as the constant.

【0105】このように各属性判別領域毎に個別に周辺
分布を作成し、各記入領域毎に、所定の閾値以上となる
属性判別領域を検出し、所定の閾値以上となる周辺分布
を得た属性判別領域を、当該判別領域に対応した記入領
域に関しチェックが付された属性判別領域として検出す
るようにしても良い。
As described above, a marginal distribution is individually created for each attribute discrimination area, and an attribute discrimination area that exceeds a predetermined threshold is detected for each entry area, and a marginal distribution that exceeds a predetermined threshold is obtained. The attribute discrimination area may be detected as an attribute discrimination area in which a check has been made on the entry area corresponding to the discrimination area.

【0106】[0106]

【発明の効果】上述した説明からも明らかなように、こ
の発明の文字切出し装置によれば、記入領域内に記入さ
れる文字の総個数と当該記入領域に対応した属性判別領
域のチェックの有無との間に存在する相関関係に基づい
て、記入領域の切出し許容個数の下限値Gmin 及び上限
値Gmax を予め調べデータとして保持しておく。そして
記入領域内の仮の切出し開始位置又は仮の切出し終了位
置の検出総個数を、記入領域内の切出し文字総個数Mと
し、切出し文字総個数Mが切出し許容数の下限値Gmin
より小さいか切出し許容数の上限値Gmax より大きいと
きは、当該切出し文字総個数を得た仮の切出し開始位置
及び仮の切出し終了位置は、対象パタン切出し位置すな
わち切出し対象文字パタンの切出し位置として不適切で
あると判定し、仮の切出し開始位置及び仮の切出し終了
位置を補正すべく再度仮の切出し位置の検出を行なう。
また記入領域内の切出し文字総個数Mが切出し許容数の
下限値Gmin 以上であってかつ上限値Gmax 以下となる
とき、当該切出し文字総個数を得た仮の切出し開始位置
及び仮の切出し終了位置は、対象パタン切出し位置とし
て適切であると判定し、当該仮の切出し開始位置及び仮
の切出し終了位置を対象パタン切出し位置と決定する。
As is clear from the above description, according to the character extracting apparatus of the present invention, the total number of characters to be entered in the entry area and the presence / absence of the attribute discrimination area corresponding to the entry area are checked. holds based on the correlation that exists, as previously examined data the lower limit G min and an upper limit G max of cut allowable number of the entry region between the. The detected total number of the provisional cutout start position or the provisional cutout end position in the entry area is defined as the total number M of cutout characters in the entry area, and the total number M of cutout characters is the lower limit Gmin of the allowable number of cutouts.
Less than or cut when the allowable number of larger than the upper limit G max is cut start position and cut the end position of the provisional provisional obtain the clipped characters total number as cut position of the target pattern extraction position i.e. cut target character pattern It is determined that it is inappropriate, and the temporary cutout position is detected again to correct the temporary cutout start position and the temporary cutout end position.
When the total number M of cut-out characters in the entry area is equal to or more than the lower limit value G min and equal to or less than the upper limit value G max of the allowable number of cut-out characters, the provisional cut-out start position and the provisional cut-out where the total number of cut-out characters are obtained. The end position is determined to be appropriate as the target pattern cutout position, and the temporary cutout start position and the temporary cutout end position are determined as the target pattern cutout positions.

【0107】このように対象パタン切出し位置を切出し
文字総個数Mと切出し許容数の上限値Gmax 及び下限値
min との比較結果に応じて決定するので、対象パタン
切出し位置の決定を簡単に行なえる。これがため、切出
し対象文字パタンの切出し処理を高速化でき、またこれ
に加えて装置のハード化に当っては装置構成を簡単化し
装置規模の小型化を図れるという利点がある。
[0107] Since the decision in accordance with the comparison result of the upper limit value G max and the lower limit value G min of the thus cut object pattern extraction position characters total number M and cut allowable number, easy determination of the target pattern extraction position I can do it. Therefore, there is an advantage that the processing for extracting the character pattern to be extracted can be speeded up, and in addition to this, the hardware configuration of the apparatus can simplify the apparatus configuration and reduce the size of the apparatus.

【図面の簡単な説明】[Brief description of the drawings]

【図1】実施例の構成を概略的に示す機能ブロック図で
ある。
FIG. 1 is a functional block diagram schematically showing a configuration of an embodiment.

【図2】実施例の文字切出し装置で用いることのできる
帳票の一例を示す図である。
FIG. 2 is a diagram illustrating an example of a form that can be used in the character cutout device of the embodiment.

【図3】実施例で用いる帳票の画像パタンの一例を示す
図である。
FIG. 3 is a diagram illustrating an example of an image pattern of a form used in the embodiment.

【図4】(A)及び(B)はチェック無しの場合におけ
る属性判別領域の画像パタン及び当該画像パタンに関す
る累積文字画素数を示す図である。
FIGS. 4A and 4B are diagrams showing an image pattern of an attribute determination area and a cumulative number of character pixels relating to the image pattern when no check is made.

【図5】(A)及び(B)はチェック有りの場合におけ
る属性判別領域の画像パタン及び当該画像パタンに関す
る累積文字画素数を示す図である。
FIGS. 5A and 5B are diagrams showing an image pattern of an attribute determination area and a cumulative number of character pixels relating to the image pattern when there is a check;

【図6】(A)及び(B)は記入領域の画像パタン及び
累積文字画素数を示す図である。
FIGS. 6A and 6B are diagrams showing an image pattern and a cumulative number of character pixels in an entry area.

【図7】実施例の位置設定制御手段に着目した動作の流
れを示す図である。
FIG. 7 is a diagram showing a flow of operation focusing on the position setting control means of the embodiment.

【図8】実施例の文字切出し装置で用いることのできる
帳票の他の例を示す図である。
FIG. 8 is a diagram showing another example of a form that can be used in the character cutout device of the embodiment.

【符号の説明】[Explanation of symbols]

10:文字切出し装置 12:画像記憶手段 14:フォーマット記憶手段 16:切出し許容数設定手段 18:切出し位置決定手段 20:パタン読出し手段 10: Character extraction device 12: Image storage unit 14: Format storage unit 16: Allowable extraction number setting unit 18: Extraction position determination unit 20: Pattern reading unit

フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/82 Continuation of the front page (58) Field surveyed (Int.Cl. 7 , DB name) G06K 9/00-9/82

Claims (3)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 切出し対象文字が記入される記入領域と
当該記入領域に対応する属性判別領域とを有する帳票の
画像パタンから、切出し対象文字パタンを切り出す文字
切出し装置において、 属性判別領域の画像パタンを走査して周辺分布を作成
し、該属性判別領域の周辺分布を用いて属性判別領域の
チェックの有無を検出し、当該検出結果に対応した切出
し許容個数の上限値及び下限値を設定する切出し許容数
設定手段と、 記入領域の画像パタンから文字要素パタンを検出し、該
文字要素パタンの検出位置を用いて仮の切出し位置を設
定し、該仮の切出し位置を用いて前記記入領域の仮の切
出し文字総個数を求め、該仮の切出し文字総個数が、前
記切出し許容個数の上限値よりも大きいとき及び前記切
出し許容個数の下限値よりも小さいときは、前記仮の切
出し位置を補正すると共に当該補正位置を用いて仮の切
出し文字総個数を求め直し、該仮の切出し文字総個数
が、前記切出し許容個数の上限値以下であってかつ切出
し許容個数の下限値以上となったとき、当該仮の切出し
文字総個数を得た仮の切出し位置を、対象パタン切出し
位置として決定する切出し位置決定手段と、 該対象パタン切出し位置を用いて切出し対象文字パタン
を切り出すパタン読出し手段とを備えて成ることを特徴
とする文字切出し装置。
1. A character extracting apparatus for extracting a character pattern to be extracted from an image pattern of a form having an entry area in which a character to be extracted is entered and an attribute determination area corresponding to the entry area. To create a marginal distribution, detect presence / absence of the attribute discrimination area using the marginal distribution of the attribute discrimination area, and set an upper limit value and a lower limit value of the permissible number of pieces corresponding to the detection result. An allowable number setting unit, detecting a character element pattern from the image pattern of the writing area, setting a temporary cutout position using the detected position of the character element pattern, and using the temporary cutout position to temporarily set the temporary setting of the writing area. When the total number of cut-out characters is determined, the provisional cut-out character total number is larger than the upper limit of the cut-out allowable number and smaller than the lower limit of the cut-out allowable number. Correcting the provisional cutout position and recalculating the provisional cutout character total number using the corrected position, and the provisional cutout character total number is equal to or less than the upper limit of the cutout allowable number and the cutout allowable number. And a cutout position determining means for determining, as a target pattern cutout position, a tentative cutout position at which the tentative cutout character total number is obtained, and a cutout target character pattern using the target pattern cutout position. A character readout unit for extracting a character.
【請求項2】 請求項1記載の文字切出し装置におい
て、 各属性判別領域毎に個別に作成した周辺分布を正規化
し、各記入領域毎に、正規化した周辺分布のなかで最大
となる周辺分布を検出し、最大の周辺分布を得た属性判
別領域を、当該判別領域に対応した記入領域に関しチェ
ックが付された属性判別領域として検出することを特徴
とする文字切出し装置。
2. The character extracting apparatus according to claim 1, wherein the marginal distribution created individually for each attribute discrimination area is normalized, and the marginal distribution which is the largest among the normalized marginal distributions for each entry area. A character segmentation device that detects the attribute discrimination area that has obtained the maximum peripheral distribution as an attribute discrimination area that has been checked for an entry area corresponding to the discrimination area.
【請求項3】 請求項1記載の文字切出し装置におい
て、 各属性判別領域毎に個別に周辺分布を作成し、各記入領
域毎に、所定の閾値以上となる属性判別領域を検出し、
所定の閾値以上となる周辺分布を得た属性判別領域を、
当該判別領域に対応した記入領域に関しチェックが付さ
れた属性判別領域として検出することを特徴とする文字
切出し装置。
3. A character segmentation device according to claim 1, wherein a marginal distribution is created individually for each attribute discrimination area, and an attribute discrimination area exceeding a predetermined threshold is detected for each entry area.
The attribute discrimination area that has obtained the marginal distribution that is equal to or more than the predetermined threshold value,
A character cutout device, which detects an entry area corresponding to the determination area as an attribute determination area with a check.
JP02665195A 1995-02-15 1995-02-15 Character extraction device Expired - Fee Related JP3145264B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP02665195A JP3145264B2 (en) 1995-02-15 1995-02-15 Character extraction device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02665195A JP3145264B2 (en) 1995-02-15 1995-02-15 Character extraction device

Publications (2)

Publication Number Publication Date
JPH08221516A JPH08221516A (en) 1996-08-30
JP3145264B2 true JP3145264B2 (en) 2001-03-12

Family

ID=12199350

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02665195A Expired - Fee Related JP3145264B2 (en) 1995-02-15 1995-02-15 Character extraction device

Country Status (1)

Country Link
JP (1) JP3145264B2 (en)

Also Published As

Publication number Publication date
JPH08221516A (en) 1996-08-30

Similar Documents

Publication Publication Date Title
JP3278471B2 (en) Area division method
JP2004158036A (en) Computer system for identifying area on instance of machine-readable form
JP3145264B2 (en) Character extraction device
JP2644041B2 (en) Character recognition device
JP2985893B2 (en) Pattern recognition device
JP4281236B2 (en) Image recognition apparatus, image recognition method, and computer-readable recording medium storing image recognition program
JP2000090194A (en) Image processing method and image processor
JPH08235311A (en) Character recognition device
JP3476595B2 (en) Image area division method and image binarization method
JP2902097B2 (en) Information processing device and character recognition device
JP2001022883A (en) Character recognizing system and recording medium for realizing function for the same
JP2001236467A (en) Method and device for pattern recognition, and recording medium with pattern recognition program recorded thereon
JPH07230525A (en) Method for recognizing ruled line and method for processing table
JP2581809B2 (en) Character extraction device
JP3100825B2 (en) Line recognition method
JP2993533B2 (en) Information processing device and character recognition device
JP2902904B2 (en) Character recognition device
JP2902905B2 (en) Character recognition device
JP2827288B2 (en) Character recognition device
JP3226355B2 (en) Recognition result evaluation method
JPH0492994A (en) Character recognizing device
JPH01277989A (en) Character string pattern reader
KR20220168787A (en) Method to extract units of Manchu characters and system
JP3277977B2 (en) Character recognition method
JPH05174179A (en) Document image processor

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20001219

LAPS Cancellation because of no payment of annual fees