JPH1125221A - Optical character reader read - Google Patents

Optical character reader read

Info

Publication number
JPH1125221A
JPH1125221A JP9173385A JP17338597A JPH1125221A JP H1125221 A JPH1125221 A JP H1125221A JP 9173385 A JP9173385 A JP 9173385A JP 17338597 A JP17338597 A JP 17338597A JP H1125221 A JPH1125221 A JP H1125221A
Authority
JP
Japan
Prior art keywords
filter
character
recognition
filters
changed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP9173385A
Other languages
Japanese (ja)
Inventor
Susumu Naitsu
将 内津
Yuji Hamazaki
祐児 浜崎
Hajime Sato
元 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP9173385A priority Critical patent/JPH1125221A/en
Publication of JPH1125221A publication Critical patent/JPH1125221A/en
Withdrawn legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To adjust a binary picture to a picture suited to character recognition in an optical character reader for operating character recognition by turning the picture of a slip into a binary picture. SOLUTION: A binarizing circuit 13 generates a binary picture by binarizing the multilevel picture of a slip stored in a multilevel data buffer 12 by a set threshold, and a filter part 15 shapes a character pattern in the binary picture by a filter processing, and stores it in a binary data buffer 16-1. A recognizing circuit 16-2 operates character recognition for the binary picture stored in the binary data buffer 16-1, and in case of illegibility in the character recognition, the recognizing circuit 16-2 operates the character recognition again by operating binarization by changing a threshold in the binarizing circuit 13. At this point, a filter selecting part 14 selects a plurality of filters 15-1-15-n in the filter part 15 according to the number of times of the character recognition, and the adjustment of the binary picture is operated in a shaping manner different from that in the previous filter processing.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、帳票の画像を光学
的に取得し、該帳票に記載された文字の認識を行う光学
式文字読取装置(以下、OCRという)に関するもので
ある。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an optical character reader (hereinafter, referred to as OCR) for optically acquiring an image of a form and recognizing characters described on the form.

【0002】[0002]

【従来の技術】図2は、従来のOCRの要部を示す構成
図である。このOCRは、帳票の画像を光学的に取得
し、光電変換によって該取得した画像に対応する多値デ
ータを生成する光電変換部1と、その多値データを格納
する多値データバッファ2とを備えている。多値データ
バッファ2の出力側には、2値化回路3aとフィルタ3
bとが順に接続され、該フィルタ3bの出力側には認識
部4が配置されている。認識部4は、フィルタ3bの出
力端子に接続された2値化データバッファ4aと、該2
値化データバッファ4bの出力側に接続された認識回路
4bとで構成されている。このOCRには、さらに、制
御部5が設けられている。制御部5は、光電変換部1、
多値データバッファ2、及び認識回路4bの制御を行う
ものである。次に、このOCRにおける各部の動作を説
明する。帳票上の文字部分の図形文字(以下、単に文字
という)を光電変換部1が多値階調のディジタルデータ
に変換し、このディジタルデータが多値データバッファ
2に与えられる。多値データバッファ2は、多値階調の
ディジタルデータを蓄積して帳票の多値画像を格納す
る。
2. Description of the Related Art FIG. 2 is a configuration diagram showing a main part of a conventional OCR. The OCR includes a photoelectric conversion unit 1 that optically acquires a form image and generates multivalued data corresponding to the acquired image by photoelectric conversion, and a multivalued data buffer 2 that stores the multivalued data. Have. On the output side of the multi-level data buffer 2, a binarizing circuit 3a and a filter 3
b are sequentially connected, and a recognition unit 4 is arranged on the output side of the filter 3b. The recognizing unit 4 includes a binarized data buffer 4a connected to an output terminal of the filter 3b,
It comprises a recognition circuit 4b connected to the output side of the quantified data buffer 4b. The OCR is further provided with a control unit 5. The control unit 5 includes the photoelectric conversion unit 1,
The multi-level data buffer 2 and the recognition circuit 4b are controlled. Next, the operation of each unit in the OCR will be described. The photoelectric conversion unit 1 converts a graphic character (hereinafter, simply referred to as a character) in a character portion on the form into digital data of multi-value gradation, and this digital data is provided to a multi-value data buffer 2. The multi-level data buffer 2 stores multi-level digital data and stores a multi-level image of a form.

【0003】2値化回路3aは、多値データバッファ2
から読出した多値のディジタルデータを2値化し、帳票
の2値画像となる2値データを生成する。フィルタ3b
がフィルタ処理でその2値データを平滑化して帳票の2
値画像を整形する。フィルタ処理された2値データは、
認識部4中の2値データバッファ4aに与えられて蓄積
される。認識回路4bは、2値データバッファ4aに蓄
積された2値画像に対して認識処理を行い、帳票に記載
された文字を認識する。認識結果は制御部5に出力され
る。以上の動作のうち、認識結果や文字の形状に関する
情報をパラメータとして用いて精度の高い認識が行える
ような2値データを、2値データバッファ4aから認識
回路4bヘ送ることを、認識制御と呼ぶ。同制御の流れ
を図3で説明する。図3は、図2の認識制御を示すフロ
ーチャートであり、処理S1〜S7が示されている。図
3の処理S1において、図示しないセンサ系を用いた光
電変換部1の動作により、帳票上の記入文字は多値のイ
メージデータ(多値階調のディジタルデータ)に変換さ
れる。多値のイメージデータは、処理S2の2値化過程
において、一定の閾値でスライスされて2値データに変
換される。処理S3において、文字の線幅を評価する平
均線幅Wを2値データから算出する。
[0003] The binarizing circuit 3a includes a multi-level data buffer 2
Of the multi-valued digital data read from the document, and generates binary data to be a binary image of the form. Filter 3b
Smoothes the binary data by filter processing, and
Shape the value image. The filtered binary data is
The binary data is supplied to the binary data buffer 4a in the recognizing unit 4 and accumulated. The recognition circuit 4b performs a recognition process on the binary image stored in the binary data buffer 4a, and recognizes a character described in a form. The recognition result is output to the control unit 5. In the above operations, sending binary data from the binary data buffer 4a to the recognition circuit 4b so that highly accurate recognition can be performed using the recognition result and information on the shape of the character as parameters is called recognition control. . The flow of the control will be described with reference to FIG. FIG. 3 is a flowchart showing the recognition control of FIG. 2, and shows the processes S1 to S7. In the process S1 of FIG. 3, the characters entered on the form are converted into multi-valued image data (multi-valued gradation digital data) by the operation of the photoelectric conversion unit 1 using a sensor system (not shown). The multi-valued image data is sliced with a fixed threshold value and converted into binary data in the binarization process of the process S2. In step S3, an average line width W for evaluating the line width of the character is calculated from the binary data.

【0004】図4は、平均線幅の算出の説明図である。
実際の文字パタンは複雑なので、ここでは、図4のよう
に長方形の簡略したモデルで、四黒点を用いて平均線幅
Wを計算する例を説明する。例えば、文字パタン6が4
×10の黒点で形成されているものとすると、その総黒
点数は40である。この文字パタン6を、大きさが2×
2の格子のパタン7で走査する。このとき、2×2の格
子パタン7のうちの1点を基準黒点8とし、該基準黒点
8で文字パタン6の画素を走査する。走査において、2
×2の格子パタン7の4点に対応する文字パタン6の画
素がすべて黒となる場合、このときの基準黒点8に対応
する文字パタン6上の点を四黒点とする。このようにし
て、文字パタン6の画素を走査すると、四黒点になる画
素は、図4にハッチングで示す領域9になる。この領域
9に基づき、平均線幅Wが次の(1)式で求められる。 W=A/(A−Q) ・・・(1) 但し、A;総黒点数 Q;四黒点数 この(1)式を図4に適用すると、平均線幅Wは40/
(40−27)=3.1となる。
FIG. 4 is an explanatory diagram for calculating an average line width.
Since the actual character pattern is complicated, an example in which the average line width W is calculated using four black points using a simplified model of a rectangle as shown in FIG. 4 will be described. For example, if character pattern 6 is 4
Assuming that it is formed of × 10 black spots, the total number of black spots is 40. This character pattern 6 has a size of 2 ×
Scanning is performed using the pattern 7 of the grid 2. At this time, one of the 2 × 2 grid patterns 7 is set as a reference black point 8, and the pixels of the character pattern 6 are scanned with the reference black point 8. In the scan, 2
When all the pixels of the character pattern 6 corresponding to the four points of the × 2 lattice pattern 7 are black, the points on the character pattern 6 corresponding to the reference black point 8 at this time are defined as four black points. In this way, when the pixels of the character pattern 6 are scanned, the pixels that become four black dots become the area 9 indicated by hatching in FIG. Based on this area 9, the average line width W is obtained by the following equation (1). W = A / (A−Q) (1) where A; total number of black spots Q; four black spots When this equation (1) is applied to FIG. 4, the average line width W is 40 /
(40−27) = 3.1.

【0005】図5は、2値化閾値による文字パタンの変
化の説明図である。OCRにおける多値階調のディジタ
ルデータは、通常8階調で構成されており、2値化過程
でスライスする際の2値化閾値THは、0から7の値を
とる。0は最も淡く、7は最も濃い階調である。閾値T
Hを0から7の変化させることによって、図5のように
文字パタンが変化して整形される。閾値THが大きくな
るにつれて、文字パタンの線幅が太くなる。そして、閾
値THが0のときの文字パタンはかすれており、パタン
に切れが生じている。普通、線幅が極端に太かったり、
細かったりすると、文字のつぶれやかすれ、切れが多く
なり、文字認識には適さない。従来の認識制御では線幅
をパラメータとし、線幅がある一定の範囲の値を採った
場合に、認識を行うようにしている。未知の文字パタン
が光電変換部1中のセンサー系で読み取られた後の、最
初の2値化の段階では、閾値THを0から7のどの値で
2値化するのか確定できない。そのため、現状のOCR
は1回目の閾値THを固定の値として設定している。こ
の値を突入の閾値と呼ぶ。
FIG. 5 is an explanatory diagram of a change in a character pattern according to a binarization threshold. Digital data of multi-level gradation in the OCR is generally composed of eight gradations, and the binarization threshold TH at the time of slicing in the binarization process takes a value from 0 to 7. 0 is the lightest and 7 is the darkest gradation. Threshold T
By changing H from 0 to 7, the character pattern is changed and shaped as shown in FIG. As the threshold value TH increases, the line width of the character pattern increases. When the threshold value TH is 0, the character pattern is blurred, and the pattern is cut. Usually, the line width is extremely thick,
If it is fine, the characters will be crushed, faded, and cut, which is not suitable for character recognition. In the conventional recognition control, the line width is used as a parameter, and recognition is performed when the line width takes a value within a certain range. At the first binarization stage after the unknown character pattern is read by the sensor system in the photoelectric conversion unit 1, it is not possible to determine which of the thresholds TH to be binarized from 0 to 7. Therefore, the current OCR
Sets the first threshold value TH as a fixed value. This value is called an inrush threshold.

【0006】図3の処理S3では、突入の閾値によって
2値化されたデータに基づき、平均線幅Wを算出する。
処理S4では、算出した平均線幅Wが線幅許容値の範囲
内にあるとき認識可能のパタンであると判定(Y)し、
データを認識部4へ送る。文字パタンの平均線幅Wがこ
の範囲に入っていない場合、認識に不適切であると判定
(N)し、処理S5で2値化閾値THを変え、再度、処
理S3,S4,S5を行う。つまり、平均線幅Wが線幅
許容値の範囲内にないと判断した場合、処理S3,S
4,S5の動作が繰り返される。この時、平均線幅Wが
太い方にある時は、閾値THを1減じ、逆に細い方にあ
る時は1増やす。平均線幅Wが線幅許容値の範囲内にあ
った場合の処理S6において、認識回路4bが、各文字
のカテゴリの判定アルゴリズムを備えた認識辞書を用い
て認識を行う。最終的に、この処理S6で得られた認識
結果が、図示しないディスプレイ等に表示される。
In a process S3 shown in FIG. 3, an average line width W is calculated based on the data binarized by the inrush threshold value.
In processing S4, when the calculated average line width W is within the allowable line width range, it is determined that the pattern is recognizable (Y),
The data is sent to the recognition unit 4. If the average line width W of the character pattern does not fall within this range, it is determined that it is inappropriate for recognition (N), the binarization threshold value TH is changed in step S5, and steps S3, S4, and S5 are performed again. . That is, when it is determined that the average line width W is not within the range of the line width allowable value, the processes S3 and S3 are performed.
The operations of 4, S5 are repeated. At this time, when the average line width W is on the thick side, the threshold value TH is decreased by 1, and when the average line width W is on the thin side, the threshold value TH is increased by 1. In the process S6 when the average line width W is within the allowable line width range, the recognition circuit 4b performs recognition using a recognition dictionary provided with an algorithm for determining the category of each character. Finally, the recognition result obtained in step S6 is displayed on a display or the like (not shown).

【0007】[0007]

【発明が解決しようとする課題】しかしながら、従来の
OCRでは、次のような課題があった。図6(a),
(b)は、図2の課題の説明図であり、同図(a)は閾
値THに応じて文字パタンが変化した場合、同図(b)
はその変化が無い場合をそれぞれ示している。帳票の種
類や光電変換部1中のセンサの調整等により、2値化し
た文字パタンに、閾値THごとの変化がほとんど無いこ
とがある。本来であれば、図6(a)のように、例えば
閾値THを4〜6に変化させるとそれに応じて文字パタ
ンも変化する筈であるが、例えばセンサの調整具合によ
って、図6(b)ようにほとんど変化しないことがあ
る。こういった文字パタンは1回目のパタンで不読して
しまうと、2回目以降も不読してしまい、現状のOCR
の仕様では、スキャン回数オーバーで、最終結果が不読
文字となる。即ち、認識制御の効果が現れにくく、結果
として、OCRの認識精度が劣化するという課題があっ
た。
However, the conventional OCR has the following problems. FIG. 6 (a),
2B is an explanatory diagram of the problem in FIG. 2, and FIG. 2A is a diagram when the character pattern changes according to the threshold value TH.
Indicates a case where there is no change. Depending on the type of the form, adjustment of the sensor in the photoelectric conversion unit 1, and the like, the binarized character pattern may hardly change for each threshold value TH. Normally, as shown in FIG. 6A, for example, if the threshold value TH is changed from 4 to 6, the character pattern should also change in accordance with the change. However, for example, FIG. May hardly change. If such a character pattern is unread in the first pattern, it will be unread in the second and subsequent times, and the current OCR
According to the specification, when the number of scans is exceeded, the final result is unreadable characters. That is, there is a problem that the effect of the recognition control is hard to appear, and as a result, the recognition accuracy of the OCR is deteriorated.

【0008】[0008]

【課題を解決するための手段】前記課題を解決するため
に、第1〜第11の発明は、文字が記入された帳票の画
像を光学的に取り込むと共に該画像を光電変換し、該帳
票の画像を多値階調で表す多値データを生成する光電変
換部と、前記多値データを格納する多値データバッファ
と、前記多値データバッファから読出した多値データを
設定された閾値で2値化し、前記帳票に対応する2値画
像を生成する2値化回路と、前記2値化回路の出力する
2値画像に対してフィルタ処理を施して該2値画像中の
文字パタンを整形するフィルタ部と、前記フィルタ処理
された2値画像に対して認識処理を行って前記文字を認
識する認識回路とを備え、前記認識回路で前記文字を認
識できない場合には、前記閾値を変更した前記2値化と
再度の前記フィルタ処理とを行った上で前記認識部によ
る再認識処理で前記文字を認識するOCRにおいて、次
のような構成にしている。
In order to solve the above-mentioned problems, the first to eleventh inventions optically capture an image of a form in which characters are written, photoelectrically convert the image, and convert the image into an image. A photoelectric conversion unit for generating multi-value data representing an image in multi-valued gradation; a multi-value data buffer for storing the multi-value data; and a multi-value data read from the multi-value data buffer at a set threshold of 2 A binarization circuit for generating a binary image corresponding to the form, and filtering the binary image output from the binarization circuit to shape a character pattern in the binary image A filter unit, and a recognition circuit that recognizes the character by performing a recognition process on the filtered binary image, and when the recognition circuit cannot recognize the character, the threshold value is changed. Binarization and re-filling In recognizing OCR the characters in re-recognition processing by the recognition unit after performing the process, and the following structure.

【0009】即ち、前記フィルタ部は、前記2値化回路
の生成した2値画像中の文字パタンを異なるフィルタ特
性でそれぞれ整形する複数のフィルタを持つ構成とし、
前記閾値を変更する毎に前記複数のフィルタの選択を切
替えるフィルタ選択部を設け、前記閾値を変更する毎に
前記選択されたフィルタで前記フィルタ処理を行って前
記再認識処理を行う構成にしている。第1〜第11の発
明によれば、以上のようにOCRを構成したので、最初
に認識回路で文字を認識できない場合に、閾値を変更し
た2値化と再度のフィルタ処理とを行った上で認識回路
による再認識処理で文字が認識される。ここで、閾値を
変更した2値化でも、文字認識に適した2値画像が得ら
れないときでも、異なるフィルタ特性を持つフィルタが
選択されるので、文字パタンの整形度合が変化し、文字
の認識が可能になる。従って、前記課題を解決できるの
である。
That is, the filter section has a plurality of filters for shaping a character pattern in a binary image generated by the binarization circuit with different filter characteristics.
A filter selection unit for switching the selection of the plurality of filters is provided each time the threshold value is changed, and the re-recognition processing is performed by performing the filter processing with the selected filter each time the threshold value is changed. . According to the first to eleventh aspects of the present invention, since the OCR is configured as described above, when a character cannot be recognized by the recognition circuit for the first time, binarization with a changed threshold value and filter processing are performed again. The character is recognized by the re-recognition processing by the recognition circuit. Here, even if the threshold value is changed and the binary image suitable for character recognition cannot be obtained, a filter having a different filter characteristic is selected. Recognition becomes possible. Therefore, the above problem can be solved.

【0010】[0010]

【発明の実施の形態】第1の実施形態 図1は、本発明の第1の実施形態を示すOCRの構成図
である。このOCRは、帳票の画像を光学的に取得し、
光電変換によって該取得した画像を多値階調で表す多値
データを生成する光電変換部11と、その多値データを
帳票のイメージデータとして格納する多値データバッフ
ァ12とを備えている。多値データバッファ12の出力
側には、イメージデータを2値化して2値画像化する2
値化回路13が接続されている。これらの光電変換部1
1、多値データバッファ12及び2値化回路13は、従
来と同様のもので構成されている。2値化回路13の出
力側には、従来にはなかったフィルタ選択部14が接続
され、該フィルタ選択部14の出力側にフィルタ部15
が配置されている。フィルタ部15は、フィルタ特性の
異なる複数のn個のフィルタ15−1,15−2,…,
15−nを有している。これらのフィルタ15−1,1
5−2,…,15−nが、フィルタ選択部14によって
選択され、選択されたフィルタが2値データに対するフ
ィルタ処理を行う構成になっている。フィルタ部15の
出力側に、認識部16が接続されている。認識部16
は、フィルタ処理によって整形された2値画像を従来と
同様に格納する2値データバッファ16−1と、従来と
同様の認識回路16−2とを備えている。このOCRに
は、認識制御を行うための制御部17が設けられ、該制
御部17からの制御により、光電変換部11、多値デー
タバッファ12、2値化回路13、フィルタ選択部1
4、認識部16がそれぞれ動作するようになっている。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS First Embodiment FIG. 1 is a block diagram of an OCR showing a first embodiment of the present invention. This OCR optically acquires the image of the form,
The image processing apparatus includes a photoelectric conversion unit 11 that generates multivalued data representing the obtained image by multivalued gradation by photoelectric conversion, and a multivalued data buffer 12 that stores the multivalued data as image data of a form. The output side of the multi-level data buffer 12 converts the image data into a binary image by binarization.
The value conversion circuit 13 is connected. These photoelectric conversion units 1
1, the multi-level data buffer 12 and the binarization circuit 13 are the same as those of the related art. An output side of the binarization circuit 13 is connected to a filter selection unit 14 which has not been provided in the related art.
Is arranged. The filter unit 15 includes a plurality of n filters 15-1, 15-2,.
15-n. These filters 15-1, 1
5-2,..., 15-n are selected by the filter selection unit 14, and the selected filter performs a filtering process on the binary data. A recognition unit 16 is connected to an output side of the filter unit 15. Recognition unit 16
Has a binary data buffer 16-1 for storing the binary image shaped by the filter processing in the same manner as in the related art, and a recognition circuit 16-2 in the same manner as in the related art. The OCR is provided with a control unit 17 for performing recognition control. Under the control of the control unit 17, the photoelectric conversion unit 11, the multi-value data buffer 12, the binarization circuit 13, the filter selection unit 1
4. The recognition unit 16 operates.

【0011】次に、図1のOCRの各部の動作を説明す
る。光電変換部11は、光学的に入力した帳票画像を多
値階調のディジタルデータに変換し、このディジタルデ
ータを多値データバッファ12に与える。多値データバ
ッファ12は、多値階調のディジタルデータを蓄積して
帳票のイメージを格納する。2値化回路13は、多値デ
ータバッファ12から読出したディジタルデータを設定
された閾値で2値化し、帳票の2値画像となる2値デー
タを生成する。フィルタ選択部14は、フィルタ部15
がフィルタ処理が行う前に、対象文字に対する認識回数
であるスキャン回数の情報を取得し、フィルタ部15中
のフィルタ15−1,15−2,…,15−nのうちの
いずれかを選択する。フィルタ部15は、フィルタ選択
部14によって選択されたフィルタを用い、2値データ
に対するフィルタ処理を行って2値画像とその中の文字
パタンを整形し、2値データバッファ16−1に与え
る。2値データバッファ16−1は、フィルタ処理され
た2値画像を格納する。認識回路16−2が、2値デー
タバッファ16−1に格納された2値画像に対して文字
認識を行う。
Next, the operation of each part of the OCR shown in FIG. 1 will be described. The photoelectric conversion unit 11 converts the optically input form image into digital data of multi-level gradation, and supplies the digital data to the multi-level data buffer 12. The multilevel data buffer 12 stores digital data of multilevel gradation and stores an image of a form. The binarization circuit 13 binarizes the digital data read from the multi-level data buffer 12 with a set threshold value, and generates binary data to be a binary image of the form. The filter selection unit 14 includes a filter unit 15
Obtains information on the number of scans, which is the number of times of recognition of the target character, before performing the filtering process, and selects one of the filters 15-1, 15-2,..., 15-n in the filter unit 15. . The filter unit 15 performs a filtering process on the binary data using the filter selected by the filter selecting unit 14, shapes the binary image and the character pattern therein, and provides the binary image to the binary data buffer 16-1. The binary data buffer 16-1 stores the filtered binary image. The recognition circuit 16-2 performs character recognition on the binary image stored in the binary data buffer 16-1.

【0012】以上が各部の基本動作であるが、制御部1
7は、認識結果や文字の形状に関する情報をパラメータ
として用い、精度の高い認識が行えるような2値データ
を2値データバッファ16−1から認識回路16−2ヘ
送るために、図7の認識制御を行う。図7は、図1の認
識制御を示すフローチャートであり、認識制御に応じた
各部の処理S11〜S18が示されている。処理S11
において、図示しないセンサ系を用いた光電変換部11
の動作により、帳票上の文字は多値階調のディジタルデ
ータに変換されてイメージデータとして多値データバッ
ファ12に格納される。処理S12の2値化過程におい
て、多値階調のイメージデータは、2値化回路13によ
って一定の閾値でスライスされて2値画像に変換され
る。処理S13のフィルタ選択処理において、フィルタ
選択部14は、2値画像生成時にスキャンが何回目であ
るかの情報を読み込み、それに応じてフィルタ部15中
のフィルタを選択する。
The above is the basic operation of each unit.
7 transmits the binary data from the binary data buffer 16-1 to the recognition circuit 16-2 so that highly accurate recognition can be performed using the recognition result and information on the shape of the character as parameters. Perform control. FIG. 7 is a flowchart showing the recognition control of FIG. 1, and shows processes S11 to S18 of each unit according to the recognition control. Processing S11
, The photoelectric conversion unit 11 using a sensor system (not shown)
The character on the form is converted into digital data of multi-value gradation by the operation of and stored in the multi-value data buffer 12 as image data. In the binarization process of the process S12, the multi-value gradation image data is sliced by the binarization circuit 13 at a fixed threshold and converted into a binary image. In the filter selection process of the process S13, the filter selection unit 14 reads information on the number of times of scanning when generating a binary image, and selects a filter in the filter unit 15 according to the information.

【0013】図8は、図1のフィルタの選択の説明図で
ある。例えば、認識回路16中に、認識対象の文字に対
するスキャン回数をパラメータとしたフィルタ選択用の
フィルタテーブル16Tを用意し、スキャン回数毎にそ
のスキャン時に使用するフィルタを記述しておく。これ
により、フィルタ選択部14はフィルタテーブル16T
に基づき、例えば図8のように、スキャン回数が1回目
のときフィルタ15−1、2回目のときフィルタ15−
2、3回目のとき15−3を選択する。処理14におい
て、フィルタ部15は、フィルタ選択部14によって選
択されたフィルタを用いて2値化回路13が出力する2
値画像のフィルタ処理を行い、文字認識に適したパタン
を形成して2値データバッファ16−1に格納する。図
9は、フィルタ処理の概念の説明図であり、図10は、
フィルタ処理の計算方法を示す図である。図11は、フ
ィルタ処理の適用例を示す図である。
FIG. 8 is an explanatory diagram of the selection of the filter shown in FIG. For example, a filter table 16T for selecting a filter is prepared in the recognition circuit 16 using the number of scans for the character to be recognized as a parameter, and a filter to be used for the scan is described for each number of scans. As a result, the filter selection unit 14 sets the filter table 16T
For example, as shown in FIG. 8, when the number of scans is the first time, the filter 15-1 and when the number of scans is two, the filter 15-
At the second and third times, 15-3 is selected. In the processing 14, the filter unit 15 uses the filter selected by the filter selection unit 14 to output the 2
The value image is filtered to form a pattern suitable for character recognition and stored in the binary data buffer 16-1. FIG. 9 is an explanatory diagram of the concept of the filtering process, and FIG.
It is a figure showing the calculation method of filter processing. FIG. 11 is a diagram illustrating an application example of the filter processing.

【0014】フィルタ部15中の各フィルタは、例えば
3×3の格子データを持ち、着目画素の画素値を設定す
る。図9では、3種類の格子データ21,22,23が
示されている。3×3の格子データ21,22,23の
中心は、それぞれ周辺に対して重み付けされており、こ
の重みの割合や黒点の判定閾値を変えた複数のフィルタ
15−1〜15−nを用意することにより、2値データ
で構成される2値画像中の文字パタンを全体に太くした
り、細くしたりする制御が可能になる。スキャン回数値
よって選択されたフィルタは、格子の中心を基準として
2値データのパタンを走査する。図11のパタンAは、
切れの生じた数字の「2」の文字パタンを含むが、文字
の部分を1とし(簡略化の為、白地の0表示は省略して
いる)、切れの部分を構成する白地(値は0)をパタン
Bのように点X、Y、Zとして着目する。今、点Xにつ
いて、フィルタ処理を格子データ21を用いて行うもの
とする。点Xは白点で値は0であり、周囲の8個の点は
黒点5個に対して白点4個である。そのため、点Xを中
心としたパタンAにおけるマトリクスは、黒点を1、白
点を0とした図10のデータp11〜p33からなるマトリ
クス24のようになる。点Xの値を設定する場合、次の
(1)式にしたがって、格子データ21の各数値m11
33をマトリクス24の対応したデータp11〜p33にそ
れぞれ乗じ、9格子のデータの総和を求める。
Each filter in the filter section 15 has, for example, 3 × 3 grid data and sets the pixel value of the pixel of interest. FIG. 9 shows three types of grid data 21, 22, and 23. The centers of the 3 × 3 grid data 21, 22, 23 are weighted with respect to the periphery, and a plurality of filters 15-1 to 15-n having different weight ratios and black point determination thresholds are prepared. This makes it possible to control the character pattern in a binary image composed of binary data to be thicker or thinner as a whole. The filter selected based on the scan count value scans the pattern of the binary data with reference to the center of the grid. The pattern A in FIG.
Although the character pattern of the broken number “2” is included, the character portion is set to 1 (for the sake of simplicity, white background 0 is omitted), and a white background (value is 0) constituting the cut portion ) As points X, Y, and Z like pattern B. Now, it is assumed that a filtering process is performed on the point X using the grid data 21. Point X is a white point and has a value of 0, and eight surrounding points are four black points and five black points. Therefore, the matrix in the pattern A centered on the point X is a matrix 24 including the data p 11 to p 33 in FIG. 10 where the black point is 1 and the white point is 0. When setting the value of the point X, each numerical value m 11- of the grid data 21 is set according to the following equation (1).
multiplying each m 33 to data p 11 ~p 33 of the corresponding matrix 24, obtaining the sum of 9 grid of data.

【0015】[0015]

【数1】 点Xの値は総和は5となる。あらかじめテーブルにもっ
ている判定用閾値に対し、データの総和は条件を満たす
(5以上は黒点の条件に合致)ので、基準点を黒点とす
る。同様に点Y、Zの総和は、それぞれ6及び5とな
り、黒点と判定する。以上の処理を切り出し枠範囲のす
べての点に施して得られた文字パタンが、図11のパタ
ンCになる。
(Equation 1) The value of the point X is 5 in total. The sum of the data satisfies the condition with respect to the judgment threshold value stored in the table in advance (5 or more satisfies the condition of the black point), so the reference point is set as the black point. Similarly, the sum of the points Y and Z is 6 and 5, respectively, and is determined as a black point. A character pattern obtained by performing the above processing on all points in the cutout frame range is a pattern C in FIG.

【0016】フィルタ処理後のパタンは、2値データバ
ッファ16−1を介して認識回路16−2に送られ、処
理S15の認識過程において、認識回路16−2が各文
字カテゴリの判定アルゴリズムを備えた認識辞書を用い
て文字認識処理を行う。認識結果が不読(文字コードが
得られない場合)になると、処理S17において2値化
閾値THが変更され、再び処理S12〜S16が繰り返
される。認識回路16−2で文字コードが得られた場
合、それが最終的な認識結果としてディスプレイ等に出
力されて表示される。以上のように、この第1の実施形
態のOCRでは、フィルタ特性の異なる複数のフィルタ
15−1〜15−nを備えたフィルタ部15と、該フィ
ルタを選択するフィルタ選択部14とを設け、スキャン
回数に基づきフィルタ15−1〜15−nの選択を切り
替える構成にしたので、2値化閾値THを変化させても
文字の線幅が変化しない場合でも、フィルタ特性の変化
でその線幅を変更できる。よって、文字認識の精度が向
上する。
The pattern after the filter processing is sent to the recognition circuit 16-2 via the binary data buffer 16-1, and in the recognition process of step S15, the recognition circuit 16-2 has an algorithm for determining each character category. The character recognition processing is performed using the recognition dictionary. When the recognition result becomes unreadable (when a character code is not obtained), the binarization threshold value TH is changed in step S17, and steps S12 to S16 are repeated again. When a character code is obtained by the recognition circuit 16-2, the character code is output and displayed on a display or the like as a final recognition result. As described above, in the OCR according to the first embodiment, the filter unit 15 including the plurality of filters 15-1 to 15-n having different filter characteristics and the filter selection unit 14 for selecting the filters are provided. Since the selection of the filters 15-1 to 15-n is switched based on the number of scans, even if the line width of a character does not change even if the binarization threshold TH is changed, the line width is changed by the filter characteristic. Can be changed. Therefore, the accuracy of character recognition is improved.

【0017】第2の実施形態 図12は、本発明の第2の実施形態を示すOCRの構成
図である。このOCRが第1の実施形態のOCRと異な
る点は、フィルタ選択部14をフィルタ選択部31に変
更する共に、認識回路16−2を認識回路32に変更し
たことであり、他の構成は図1と同様になっている。フ
ィルタ選択部31は、スキャン回数ではなく、2値化回
路13で変更する2値化閾値THの情報を取得し、該2
値化閾値THに応じてフィルタ部15中のフィルタ15
−1,15−2,…,15−nのうちのいずれかを選択
するようになっている。図13は、図12のフィルタの
選択の説明図である。
Second Embodiment FIG. 12 is a block diagram of an OCR showing a second embodiment of the present invention. This OCR is different from the OCR of the first embodiment in that the filter selection unit 14 is changed to the filter selection unit 31 and the recognition circuit 16-2 is changed to the recognition circuit 32. It is the same as 1. The filter selection unit 31 obtains not the number of scans but the information of the binarization threshold value TH to be changed by the binarization circuit 13,
The filter 15 in the filter unit 15 according to the threshold value TH
-1, 15-2,..., 15-n. FIG. 13 is an explanatory diagram of the selection of the filter in FIG.

【0018】認識回路32中に、2値化閾値THをパラ
メータとしたフィルタ選択用のフィルタテーブル32T
を用意し、2値化閾値TH毎に使用するフィルタを記述
しておく。これにより、フィルタ選択部31は、フィル
タテーブル32Tに基づき、例えば図13のように、2
値化閾値THが1ならばフィルタ15−1、2ならばフ
ィルタ15−2、3ならば15−3を選択する。このO
CRにおいても、図7の認識制御で文字認識を行うが、
2値化閾値THに応じて使用するフィルタの選択が変更
され、このフィルタによって整形された文字パタンに対
して認識回路32の認識処理が行われる。以上のよう
に、この第2の実施形態では、フィルタ特性の異なる複
数のフィルタ15−1〜15−nを備えたフィルタ部1
5と、該フィルタ15−1〜15−nを選択するフィル
タ選択部31とを設け、2値化閾値THに基づきフィル
タ15−1〜15−nの選択を切り替える構成にしたの
で、2値化閾値THを変化させても文字の線幅が変化し
ない場合でも、フィルタ特性の変化でその線幅を変更で
きる。よって、文字認識の精度が向上する。
In the recognition circuit 32, a filter table 32T for selecting a filter using the binarization threshold TH as a parameter
Is prepared, and a filter to be used for each binarization threshold TH is described. As a result, the filter selection unit 31 performs, for example, as shown in FIG.
If the threshold value TH is 1, the filter 15-1 is selected, if it is 2, the filter 15-2, and if it is 3, the filter 15-3 is selected. This O
In CR, character recognition is performed by the recognition control shown in FIG.
The selection of the filter to be used is changed according to the binarization threshold TH, and the recognition circuit 32 performs recognition processing on the character pattern shaped by this filter. As described above, in the second embodiment, the filter unit 1 including the plurality of filters 15-1 to 15-n having different filter characteristics is used.
5 and a filter selection unit 31 for selecting the filters 15-1 to 15-n are provided to switch the selection of the filters 15-1 to 15-n based on the binarization threshold TH. Even if the line width of a character does not change even when the threshold value TH is changed, the line width can be changed by changing the filter characteristics. Therefore, the accuracy of character recognition is improved.

【0019】第3の実施形態 図14は、本発明の第3の実施形態を示すOCRの構成
図である。このOCRが第1の実施形態のOCRと異な
る点は、フィルタ選択部14をフィルタ選択部33に変
更する共に、認識回路16−2を認識回路34に変更し
たことであり、他の構成は図1と同様になっている。フ
ィルタ選択部33は、スキャン回数ではなく、2値化デ
ータから文字パタンの複雑度の情報を検出して複雑度の
高い、普通、低いを判定し、該複雑度に応じてフィルタ
部15中のフィルタ15−1,15−2,…,15−n
のうちのいずれかを選択する構成になっている。複雑度
は、例えば2値化データで構成される2値化パタンの黒
点数と白点の数の比或いは文字パタンの大きさに対する
黒点数の比等で推定できる。図15は、図14のフィル
タの選択の説明図である。
Third Embodiment FIG. 14 is a block diagram of an OCR showing a third embodiment of the present invention. This OCR is different from the OCR of the first embodiment in that the filter selection unit 14 is changed to the filter selection unit 33 and the recognition circuit 16-2 is changed to the recognition circuit 34. It is the same as 1. The filter selection unit 33 detects information on the complexity of the character pattern from the binarized data instead of the number of scans, determines whether the complexity is high, normal, or low. Filters 15-1, 15-2, ..., 15-n
Is selected. The complexity can be estimated by, for example, the ratio of the number of black points to the number of white points of the binarized pattern composed of the binarized data, or the ratio of the number of black points to the size of the character pattern. FIG. 15 is an explanatory diagram of the selection of the filter in FIG.

【0020】認識回路34中に、複雑度をパラメータと
したフィルタ選択用のフィルタテーブル34Tを用意
し、複雑度の高い、普通、低い毎に使用するフィルタを
記述しておく。最初、フィルタ選択部33は、例えばフ
ィルタ15−1を選択してフィルタ処理を実行させ、該
選択の結果で2値データバッファ16−2に格納された
パタンから複雑度の算出と判定を行う。そして、フィル
タ選択部33はフィルタテーブル34Tに基づき、図1
5のように、複雑度が高ければ例えばフィルタ15−
1、普通ならばフィルタ15−2、低ければ15−3を
選択する。このOCRにおいても、図7の認識制御で文
字認識を行うが、複雑度に応じてフィルタの選択が変更
され、このフィルタによって整形された文字パタンに対
して認識回路34の認識処理が行われる。以上のよう
に、この第3の実施形態では、フィルタ特性の異なる複
数のフィルタ15−1〜15−nを備えたフィルタ部1
5と、該フィルタを選択するフィルタ選択部33とを設
け、複雑度に基づきフィルタ15−1〜15−nの選択
を切り替える構成にしたので、2値化閾値THを変化さ
せても文字の線幅が変化しない場合でも、フィルタ特性
の変化でその線幅を変更できる。よって、文字認識の精
度が向上する。
In the recognition circuit 34, a filter table 34T for selecting a filter using the complexity as a parameter is prepared, and a filter to be used for each of high, normal, and low complexity is described. First, the filter selecting unit 33 selects, for example, the filter 15-1 to execute the filtering process, and calculates and determines the complexity from the pattern stored in the binary data buffer 16-2 based on the selection result. Then, based on the filter table 34T, the filter selecting unit 33 performs the processing shown in FIG.
5, if the complexity is high, for example, the filter 15-
1. Select the filter 15-2 if normal and 15-3 if low. Also in this OCR, character recognition is performed by the recognition control of FIG. 7, but the selection of a filter is changed in accordance with the complexity, and the recognition processing of the character pattern shaped by this filter is performed by the recognition circuit 34. As described above, in the third embodiment, the filter unit 1 including the plurality of filters 15-1 to 15-n having different filter characteristics is used.
5 and a filter selection unit 33 for selecting the filter, and the selection of the filters 15-1 to 15-n is switched based on the complexity. Therefore, even if the binarization threshold TH is changed, the character line Even when the width does not change, the line width can be changed by changing the filter characteristics. Therefore, the accuracy of character recognition is improved.

【0021】第4の実施形態 図16は、本発明の第4の実施形態を示すOCRの構成
図である。このOCRが第1の実施形態のOCRと異な
る点は、フィルタ選択部14をフィルタ選択部35に変
更する共に、認識回路16−2を認識回路36に変更し
たことであり、他の構成は図1と同様になっている。フ
ィルタ選択部35は、スキャン回数ではなく、2値化デ
ータから文字パタンの平均線幅Wの情報を検出して太
い、普通、細いを判定し、該平均線幅Wに応じてフィル
タ部15中のフィルタ15−1,15−2,…,15−
nのうちのいずれかを選択する構成になっている。平均
線幅Wは従来と同様に2値データで構成される2値画像
から求めることができる。図17は、図16のフィルタ
の選択の説明図である。
Fourth Embodiment FIG. 16 is a block diagram of an OCR showing a fourth embodiment of the present invention. This OCR is different from the OCR of the first embodiment in that the filter selection unit 14 is changed to the filter selection unit 35 and the recognition circuit 16-2 is changed to the recognition circuit 36. It is the same as 1. The filter selecting unit 35 detects information on the average line width W of the character pattern from the binarized data, instead of the number of scans, and determines whether the character pattern is thick, normal, or thin. , 15-2, ..., 15-
n is selected. The average line width W can be obtained from a binary image composed of binary data as in the conventional case. FIG. 17 is an explanatory diagram of the selection of the filter in FIG.

【0022】認識回路36中に、複雑度をパラメータと
したフィルタ選択用のフィルタテーブル36Tを用意
し、平均線幅Wの太い、普通、細い毎に使用するフィル
タを記述しておく。最初、フィルタ選択部35は、例え
ばフィルタ15−1を選択してフィルタ処理を実行さ
せ、該選択の結果で2値データバッファ16−2に格納
されたパタンから平均線幅Wの算出と判定を行う。この
判定結果とフィルタテーブル36Tとに基づき、例えば
図17のように、平均線幅Wが太ければフィルタ15−
1、普通ならばフィルタ15−2、細ければ15−3を
選択する。このOCRにおいても、図7の認識制御で文
字認識を行うが、平均線幅Wに応じてフィルタの選択が
変更され、このフィルタによって整形した文字パタンに
対して認識回路36の認識処理が行われる。以上のよう
に、この第4の実施形態では、フィルタ特性の異なる複
数のフィルタ15−1〜15−nを備えたフィルタ部1
5と、該フィルタを選択するフィルタ選択部35とを設
け、平均線幅Wに基づきフィルタ15−1〜15−nの
選択を切り替える構成にしたので、2値化閾値THを変
化させても文字の線幅が変化しない場合でも、フィルタ
特性の変化でその線幅を変更できる。よって、文字認識
の精度が向上する。
In the recognition circuit 36, a filter table 36T for selecting a filter using the complexity as a parameter is prepared, and a filter to be used is described for each of the large, normal, and thin average line widths W. First, the filter selection unit 35 selects, for example, the filter 15-1 to execute the filter processing, and determines the calculation and determination of the average line width W from the pattern stored in the binary data buffer 16-2 based on the selection result. Do. Based on this determination result and the filter table 36T, if the average line width W is large as shown in FIG.
1. Select the filter 15-2 if normal and 15-3 if thin. Also in this OCR, character recognition is performed by the recognition control of FIG. 7, but the selection of a filter is changed in accordance with the average line width W, and the recognition processing of the character pattern shaped by this filter is performed by the recognition circuit 36. . As described above, in the fourth embodiment, the filter unit 1 including the plurality of filters 15-1 to 15-n having different filter characteristics is used.
5 and a filter selection unit 35 for selecting the filter, and the selection of the filters 15-1 to 15-n is switched based on the average line width W. Therefore, even if the binarization threshold TH is changed, Even if the line width does not change, the line width can be changed by changing the filter characteristics. Therefore, the accuracy of character recognition is improved.

【0023】第5の実施形態 図18は、本発明の第5の実施形態を示すOCRの構成
図である。このOCRが第1の実施形態のOCRと異な
る点は、フィルタ選択部14をフィルタ選択部37に変
更する共に、認識回路16−2を認識回路38に変更し
たことであり、他の構成は図1と同様になっている。フ
ィルタ選択部37は、スキャン回数と2値化閾値THの
両方に応じてフィルタ部15中のフィルタ15−1,1
5−2,…,15−nのうちのいずれかを選択する構成
になっている。図19は、図18のフィルタの選択の説
明図である。
Fifth Embodiment FIG. 18 is a block diagram of an OCR showing a fifth embodiment of the present invention. This OCR differs from the OCR of the first embodiment in that the filter selection unit 14 is changed to the filter selection unit 37 and the recognition circuit 16-2 is changed to the recognition circuit 38. It is the same as 1. The filter selector 37 filters the filters 15-1 and 15-1 in the filter 15 according to both the number of scans and the binarization threshold TH.
5-2,..., 15-n. FIG. 19 is an explanatory diagram of the selection of the filter in FIG.

【0024】認識回路38中に、スキャン回数と2値化
閾値THとをパラメータとしたフィルタ選択用のフィル
タテーブル38Tを用意し、スキャン回数と2値化閾値
THとに対応するフィルタを記述しておく。フィルタ選
択部14は、スキャン回数と2値化閾値THとフィルタ
テーブル38Tとに基づき、例えば図19のように、2
値化閾値THが1でスキャン回数が1回目のときにフィ
ルタ15−1、スキャン回数が2回目のときフィルタ1
5−2、スキャン回数が3回目のときフィルタ15−3
を選択する。2値化閾値THが2または3のときにも同
様にスキャン回数に応じてフィルタ15−4〜15−9
を選択する。このOCRにおいても、図7の認識制御で
文字認識を行うが、スキャン回数と2値化閾値THとに
応じてフィルタの選択が変更され、このフィルタによっ
て整形された文字パタンに対して認識回路38の認識処
理が行われる。以上のように、この第5の実施形態で
は、フィルタ特性の異なる複数のフィルタ15−1〜1
5−nを備えたフィルタ部15と、該フィルタを選択す
るフィルタ選択部37とを設け、スキャン回数と2値化
閾値THとに基づきフィルタ15−1〜15−nの選択
を切り替える構成にしたので、2値化閾値THを変化さ
せても文字の線幅が変化しない場合でも、フィルタ特性
の変化でその線幅を変更できる。よって、文字認識の精
度が向上する。
In the recognition circuit 38, a filter table 38T for selecting a filter using the number of scans and the binarization threshold TH as parameters is prepared, and a filter corresponding to the number of scans and the binarization threshold TH is described. deep. For example, as shown in FIG. 19, the filter selection unit 14 determines whether or not the number of scans, the binarization threshold value TH, and the filter table 38T.
Filter 15-1 when the threshold value TH is 1 and the number of scans is the first time, and Filter 1 when the number of scans is the second time
5-2, filter 15-3 when the number of scans is the third time
Select Similarly, when the binarization threshold TH is 2 or 3, the filters 15-4 to 15-9 are also set according to the number of scans.
Select Also in this OCR, character recognition is performed by the recognition control of FIG. 7, but the selection of a filter is changed according to the number of scans and the binarization threshold value TH, and the recognition circuit 38 applies the character pattern shaped by this filter. Is recognized. As described above, in the fifth embodiment, a plurality of filters 15-1 to 15-1 having different filter characteristics are provided.
5-n and a filter selection unit 37 for selecting the filter are provided, and the selection of the filters 15-1 to 15-n is switched based on the number of scans and the binarization threshold TH. Therefore, even if the line width of a character does not change even if the binarization threshold TH is changed, the line width can be changed by changing the filter characteristics. Therefore, the accuracy of character recognition is improved.

【0025】第6の実施形態 図20は、本発明の第6の実施形態を示すOCRの構成
図である。このOCRが第1の実施形態のOCRと異な
る点は、フィルタ選択部14をフィルタ選択部39に変
更する共に、認識回路16−2を認識回路40に変更し
たことであり、他の構成は図1と同様になっている。フ
ィルタ選択部39は、複雑度及び平均線幅Wの両方に応
じてフィルタ部15中のフィルタ15−1,15−2,
…,15−nのうちのいずれかを選択する構成になって
いる。図21は、図20のフィルタの選択の説明図であ
る。
Sixth Embodiment FIG. 20 is a block diagram of an OCR showing a sixth embodiment of the present invention. This OCR is different from the OCR of the first embodiment in that the filter selection unit 14 is changed to the filter selection unit 39 and the recognition circuit 16-2 is changed to the recognition circuit 40. It is the same as 1. The filter selection unit 39 selects the filters 15-1, 15-2, 15-2, and 15-3 in the filter unit 15 according to both the complexity and the average line width W.
, 15-n are selected. FIG. 21 is an explanatory diagram of the selection of the filter in FIG.

【0026】認識回路40中に、複雑度と平均線幅Wの
判定値をパラメータとしたフィルタ選択用のフィルタテ
ーブル40Tを用意し、複雑度と平均線幅Wとに対応す
るフィルタを記述しておく。フィルタ選択部14は、複
雑度及び平均線幅Wの判定値とフィルタテーブル40T
とに基づき、例えば図21のように、平均線幅Wが太く
複雑度が高い場合にはフィルタ15−1、複雑度が普通
の場合にはフィルタ15−2、複雑度が低い場合にはフ
ィルタ15−3を選択する。平均線幅Wが普通或いは細
い場合にも同様に、複雑度に応じてフィルタ15−4〜
15−9を選択する。このOCRにおいても、図7の認
識制御で文字認識を行うが、平均線幅Wに応じてフィル
タの選択が変更され、このフィルタによって整形された
文字パタンに対して認識回路40の認識処理が行われ
る。以上のように、この第5の実施形態では、フィルタ
特性の異なる複数のフィルタ15−1〜15−nを備え
たフィルタ部15と、該フィルタを選択するフィルタ選
択部39とを設け、複雑度と平均線幅Wとに基づきフィ
ルタ15−1〜15−nの選択を切り替える構成にした
ので、2値化閾値THを変化させても文字の線幅が変化
しない場合でも、フィルタ特性の変化でその線幅を変更
できる。よって、文字認識の精度が向上する。
In the recognizing circuit 40, a filter table 40T for selecting a filter is prepared by using parameters of the judgment value of the complexity and the average line width W, and a filter corresponding to the complexity and the average line width W is described. deep. The filter selecting unit 14 determines the determination values of the complexity and the average line width W and the filter table 40T.
For example, as shown in FIG. 21, the filter 15-1 is used when the average line width W is large and the complexity is high, the filter 15-2 is used when the complexity is normal, and the filter 15-2 is used when the complexity is low. Select 15-3. Similarly, when the average line width W is normal or thin, the filters 15-4 to 15-4
Select 15-9. Also in this OCR, character recognition is performed by the recognition control of FIG. 7, but the selection of a filter is changed according to the average line width W, and the recognition processing of the recognition circuit 40 is performed on the character pattern shaped by this filter. Will be As described above, in the fifth embodiment, the filter unit 15 including the plurality of filters 15-1 to 15-n having different filter characteristics and the filter selecting unit 39 for selecting the filters are provided. And the average line width W, the selection of the filters 15-1 to 15-n is switched. Therefore, even if the character line width does not change even if the binarization threshold TH is changed, the filter characteristics change. You can change the line width. Therefore, the accuracy of character recognition is improved.

【0027】第7の実施形態 図22は、本発明の第7の実施形態を示すOCRの構成
図である。このOCRが第1の実施形態のOCRと異な
る点は、フィルタ選択部14をフィルタ選択部41に変
更する共に、認識回路16−2を認識回路42に変更し
たことであり、他の構成は図1と同様になっている。フ
ィルタ選択部41は、スキャン回数と複雑度の判定値の
両方に応じてフィルタ部15中のフィルタ15−1,1
5−2,…,15−nのうちのいずれかを選択する構成
になっている。図23は、図22のフィルタの選択の説
明図である。認識回路42中に、スキャン回数と複雑度
の判定値とをパラメータとしたフィルタ選択用のフィル
タテーブル42Tを用意し、スキャン回数と複雑度とに
対応するフィルタを記述しておく。フィルタ選択部14
は、スキャン回数及び複雑度の判定値とフィルタテーブ
ル42Tとに基づき、例えば図23のように、複雑度が
高くスキャン回数が1回目のときフィルタ15−1、ス
キャン回数が2回目のときフィルタ15−2、スキャン
回数が3回目のときフィルタ15−3を選択する。複雑
度が普通或いは低い場合にも同様に、スキャン回数に応
じてフィルタ15−4〜15−9を選択する。
Seventh Embodiment FIG. 22 is a block diagram of an OCR showing a seventh embodiment of the present invention. This OCR differs from the OCR of the first embodiment in that the filter selection unit 14 is changed to the filter selection unit 41 and the recognition circuit 16-2 is changed to the recognition circuit 42. It is the same as 1. The filter selection unit 41 filters the filters 15-1 and 15-1 in the filter unit 15 according to both the number of scans and the complexity determination value.
5-2,..., 15-n. FIG. 23 is an explanatory diagram of the selection of the filter in FIG. In the recognition circuit 42, a filter table 42T for selecting a filter using the number of scans and the determination value of the complexity as parameters is prepared, and a filter corresponding to the number of scans and the complexity is described. Filter selector 14
Based on the determination values of the number of scans and the complexity, and the filter table 42T, for example, as shown in FIG. 23, the filter 15-1 is used when the complexity is high and the number of scans is first, and the filter 15 is used when the number of scans is second. -2, when the number of scans is 3, the filter 15-3 is selected. Similarly, when the complexity is normal or low, the filters 15-4 to 15-9 are selected according to the number of scans.

【0028】このOCRにおいても、図7の認識制御で
文字認識を行うが、スキャン回数と複雑度に応じてフィ
ルタの選択が変更され、このフィルタによって整形され
た文字パタンに対して認識回路42の認識処理が行われ
る。以上のように、この第7の実施形態では、フィルタ
特性の異なる複数のフィルタ15−1〜15−nを備え
たフィルタ部15と、該フィルタを選択するフィルタ選
択部41とを設け、スキャン回数と複雑度とに基づきフ
ィルタ15−1〜15−nの選択を切り替える構成にし
たので、2値化閾値THを変化させても文字の線幅が変
化しない場合でも、フィルタ特性の変化でその線幅を変
更できる。よって、文字認識の精度が向上する。
Also in this OCR, character recognition is performed by the recognition control shown in FIG. 7, but the selection of a filter is changed in accordance with the number of scans and the complexity, and the recognition circuit 42 A recognition process is performed. As described above, in the seventh embodiment, the filter unit 15 including the plurality of filters 15-1 to 15-n having different filter characteristics and the filter selection unit 41 for selecting the filter are provided. And the degree of complexity, the selection of the filters 15-1 to 15-n is switched. Therefore, even if the line width of the character does not change even if the binarization threshold value TH is changed, the line is changed by the change in the filter characteristics. You can change the width. Therefore, the accuracy of character recognition is improved.

【0029】第8の実施形態 図24は、本発明の第8の実施形態を示すOCRの構成
図である。このOCRが第1の実施形態のOCRと異な
る点は、フィルタ選択部14をフィルタ選択部43に変
更する共に、認識回路16−2を認識回路44に変更し
たことであり、他の構成は図1と同様になっている。フ
ィルタ選択部43は、スキャン回数と平均線幅Wの判定
値の両方に応じてフィルタ部15中のフィルタ15−
1,15−2,…,15−nのうちのいずれかを選択す
る構成になっている。図25は、図24のフィルタの選
択の説明図である。認識回路44中に、スキャン回数と
平均線幅Wの判定値とをパラメータとしたフィルタ選択
用のフィルタテーブル44Tを用意し、スキャン回数と
平均線幅Wとに対応するフィルタを記述しておく。フィ
ルタ選択部14は、スキャン回数及び平均線幅Wの判定
値とフィルタテーブル44Tとに基づき、例えば図25
のように、平均線幅Wが太くスキャン回数が1回目のと
きフィルタ15−1、スキャン回数が2回目のときフィ
ルタ15−2、スキャン回数が3回目のときフィルタ1
5−3を選択する。平均線幅Wが普通或いは低い場合に
も同様に、スキャン回数に応じてフィルタ15−4〜1
5−9を選択する。
Eighth Embodiment FIG. 24 is a block diagram of an OCR showing an eighth embodiment of the present invention. This OCR is different from the OCR of the first embodiment in that the filter selection unit 14 is changed to the filter selection unit 43 and the recognition circuit 16-2 is changed to the recognition circuit 44. It is the same as 1. The filter selection unit 43 determines the filter 15-in the filter unit 15 according to both the number of scans and the determination value of the average line width W.
, 15-n are selected. FIG. 25 is an explanatory diagram of the selection of the filter in FIG. In the recognition circuit 44, a filter table 44T for selecting a filter using the number of scans and the determination value of the average line width W as parameters is prepared, and a filter corresponding to the number of scans and the average line width W is described. The filter selection unit 14 determines, for example, FIG. 25 based on the determination values of the number of scans and the average line width W and the filter table 44T.
, The filter 15-1 when the average line width W is large and the number of scans is the first, the filter 15-2 when the number of scans is the second, and the filter 1 when the number of scans is the third
Select 5-3. Similarly, when the average line width W is normal or low, the filters 15-4 to 15-1 are changed according to the number of scans.
Select 5-9.

【0030】このOCRにおいても、図7の認識制御で
文字認識を行うが、スキャン回数と平均線幅Wとに応じ
てフィルタの選択が変更され、このフィルタによって整
形された文字パタンに対して認識回路44の認識処理が
行われる。以上のように、この第8の実施形態では、フ
ィルタ特性の異なる複数のフィルタ15−1〜15−n
を備えたフィルタ部15と、該フィルタを選択するフィ
ルタ選択部43とを設け、スキャン回数と平均線幅Wと
に基づきフィルタ15−1〜15−nの選択を切り替え
る構成にしたので、2値化閾値THを変化させても文字
の線幅が変化しない場合でも、フィルタ特性の変化でそ
の線幅を変更できる。よって、文字認識の精度が向上す
る。
Also in this OCR, character recognition is performed by the recognition control shown in FIG. 7, but the selection of a filter is changed according to the number of scans and the average line width W, and the character pattern shaped by this filter is recognized. The recognition processing of the circuit 44 is performed. As described above, in the eighth embodiment, a plurality of filters 15-1 to 15-n having different filter characteristics are provided.
Is provided, and a filter selection unit 43 for selecting the filter is provided, and the selection of the filters 15-1 to 15-n is switched based on the number of scans and the average line width W. Even when the line width of a character does not change even when the threshold value TH is changed, the line width can be changed by changing the filter characteristics. Therefore, the accuracy of character recognition is improved.

【0031】第9の実施形態 図26は、本発明の第9の実施形態を示すOCRの構成
図である。このOCRが第1の実施形態のOCRと異な
る点は、フィルタ選択部14をフィルタ選択部45に変
更する共に、認識回路16−2を認識回路46に変更し
たことであり、他の構成は図1と同様になっている。フ
ィルタ選択部45は、2値化閾値THと平均線幅Wの判
定値の両方に応じてフィルタ部15中のフィルタ15−
1,15−2,…,15−nのうちのいずれかを選択す
る構成になっている。図27は、図26のフィルタの選
択の説明図である。認識回路46中に、2値化閾値TH
と平均線幅Wの判定値とをパラメータとしたフィルタ選
択用のフィルタテーブル46Tを用意し、2値化閾値T
Hと平均線幅Wとに対応するフィルタを記述しておく。
フィルタ選択部14は、2値化閾値及び平均線幅Wの判
定値とフィルタテーブル46Tとに基づき、例えば図2
7のように、平均線幅Wが太く2値化閾値THが1のと
きフィルタ15−1、2値化閾値が2のときフィルタ1
5−2、2値化閾値THが3のときフィルタ15−3を
選択する。平均線幅Wが普通或いは低い場合にも同様
に、2値化閾値THに応じてフィルタ15−4〜15−
9を選択する。
Ninth Embodiment FIG. 26 is a block diagram of an OCR according to a ninth embodiment of the present invention. This OCR is different from the OCR of the first embodiment in that the filter selection unit 14 is changed to the filter selection unit 45 and the recognition circuit 16-2 is changed to the recognition circuit 46. It is the same as 1. The filter selection unit 45 determines the filter 15-in the filter unit 15 according to both the binarization threshold value TH and the determination value of the average line width W.
, 15-n are selected. FIG. 27 is an explanatory diagram of the selection of the filter in FIG. In the recognition circuit 46, the binarization threshold TH
A filter table 46T for selecting a filter using parameters and the determination value of the average line width W as parameters is prepared.
A filter corresponding to H and the average line width W is described.
The filter selecting unit 14 is configured, for example, as shown in FIG.
7, when the average line width W is large and the binarization threshold TH is 1, the filter 15-1 is used, and when the binarization threshold is 2, the filter 1 is used.
When 5-2 and the binarization threshold TH are 3, the filter 15-3 is selected. Similarly, when the average line width W is normal or low, the filters 15-4 to 15- according to the binarization threshold value TH.
Select 9.

【0032】このOCRにおいても、図7の認識制御で
文字認識を行うが、2値化閾値THと平均線幅Wとに応
じてフィルタの選択が変更され、このフィルタによって
整形された文字パタンに対して認識回路46の認識処理
が行われる。以上のように、この第9の実施形態では、
フィルタ特性の異なる複数のフィルタ15−1〜15−
nを備えたフィルタ部15と、該フィルタを選択するフ
ィルタ選択部45とを設け、2値化閾値THと平均線幅
Wとに基づきフィルタ15−1〜15−nの選択を切り
替える構成にしたので、2値化閾値THを変化させても
文字の線幅が変化しない場合でも、フィルタ特性の変化
でその線幅を変更できる。よって、文字認識の精度が向
上する。
Also in this OCR, character recognition is performed by the recognition control shown in FIG. 7, but the selection of a filter is changed in accordance with the binarization threshold value TH and the average line width W, and the character pattern shaped by this filter is converted to a character pattern. On the other hand, the recognition processing of the recognition circuit 46 is performed. As described above, in the ninth embodiment,
A plurality of filters 15-1 to 15- having different filter characteristics
n, and a filter selection unit 45 for selecting the filter are provided to switch the selection of the filters 15-1 to 15-n based on the binarization threshold TH and the average line width W. Therefore, even if the line width of a character does not change even if the binarization threshold TH is changed, the line width can be changed by changing the filter characteristics. Therefore, the accuracy of character recognition is improved.

【0033】第10の実施形態 図28は、本発明の第10の実施形態を示すOCRの構
成図である。このOCRが第1の実施形態のOCRと異
なる点は、フィルタ選択部14をフィルタ選択部47に
変更する共に、認識回路16−2を認識回路48に変更
したことであり、他の構成は図1と同様になっている。
フィルタ選択部47は、2値化閾値THと複雑度の判定
値の両方に応じてフィルタ部15中のフィルタ15−
1,15−2,…,15−nのうちのいずれかを選択す
る構成になっている。図29は、図28のフィルタの選
択の説明図である。認識回路48中に、2値化閾値TH
と複雑度の判定値とをパラメータとしたフィルタ選択用
のフィルタテーブル48Tを用意し、2値化閾値THと
複雑度とに対応するフィルタを記述しておく。フィルタ
選択部14は、2値化閾値TH及び複雑度の判定値とフ
ィルタテーブル48Tとに基づき、例えば図29のよう
に、複雑度が高く2値化閾値THが1のときフィルタ1
5−1、2値化閾値が2のときフィルタ15−2、2値
化閾値THが3のときフィルタ15−3を選択する。複
雑度が普通或いは低い場合にも同様に、2値化閾値TH
に応じてフィルタ15−4〜15−9を選択する。
Tenth Embodiment FIG. 28 is a block diagram of an OCR showing a tenth embodiment of the present invention. This OCR is different from the OCR of the first embodiment in that the filter selection unit 14 is changed to the filter selection unit 47 and the recognition circuit 16-2 is changed to the recognition circuit 48. It is the same as 1.
The filter selecting unit 47 determines the filter 15-in the filter unit 15 according to both the binarization threshold TH and the complexity determination value.
, 15-n are selected. FIG. 29 is an explanatory diagram of the selection of the filter in FIG. In the recognition circuit 48, the binarization threshold TH
A filter table 48T for selecting a filter is prepared using the parameter and the determination value of the complexity as parameters, and a filter corresponding to the binarization threshold TH and the complexity is described. Based on the binarization threshold TH and the determination value of the complexity, and the filter table 48T, the filter selection unit 14 determines whether the filter 1 has a high complexity and the binarization threshold TH is 1 as shown in FIG.
5-1: The filter 15-2 is selected when the binarization threshold is 2, and the filter 15-3 is selected when the binarization threshold TH is 3. Similarly, when the complexity is normal or low, the binarization threshold TH
Select the filters 15-4 to 15-9 according to.

【0034】このOCRにおいても、図7の認識制御で
文字認識を行うが、2値化閾値THと複雑度とに応じて
フィルタの選択が変更され、このフィルタによって整形
されけた文字パタンに対して認識回路48の認識処理が
行われる。以上のように、この第9の実施形態では、フ
ィルタ特性の異なる複数のフィルタ15−1〜15−n
を備えたフィルタ部15と、該フィルタを選択するフィ
ルタ選択部47とを設け、2値化閾値THと複雑度とに
基づきフィルタ15−1〜15−nの選択を切り替える
構成にしたので、2値化閾値THを変化させても文字の
線幅が変化しない場合でも、フィルタ特性の変化でその
線幅を変更できる。よって、文字認識の精度が向上す
る。なお、本発明は、上記実施形態に限定されず種々の
変形が可能である。例えば、第1〜第10の実施形態に
おいて、フィルタ部15に配置するフィルタは151
15n の数は任意であり、パラメータのランク数に応じ
た数だけ設ければ、上記と同様の効果を奏する。
Also in this OCR, character recognition is performed by the recognition control shown in FIG. 7, but the selection of a filter is changed according to the binarization threshold value TH and the complexity, and the character pattern shaped by this filter is The recognition processing of the recognition circuit 48 is performed. As described above, in the ninth embodiment, a plurality of filters 15-1 to 15-n having different filter characteristics are provided.
And a filter selection unit 47 for selecting the filter, the selection of the filters 15-1 to 15-n is switched based on the binarization threshold value TH and the complexity. Even if the line width of a character does not change even when the threshold value TH is changed, the line width can be changed by changing the filter characteristics. Therefore, the accuracy of character recognition is improved. Note that the present invention is not limited to the above embodiment, and various modifications are possible. For example, in the first to tenth embodiments, the filters arranged in the filter unit 15 are 15 1 to
The number of 15 n is arbitrary, and if the number corresponding to the number of ranks of the parameters is provided, the same effect as above can be obtained.

【0035】[0035]

【発明の効果】以上詳細に説明したように、第1〜第1
1の発明によれば、光電変換部と、多値データバッファ
と、2値化回路、フィルタ部と、認識回路とを備え、認
識回路で文字を認識できない場合には、閾値を変更した
2値化と再度のフィルタ処理とを行った上での再認識処
理で文字を認識する光学式文字読取装置において、フィ
ルタ部が異なるフィルタ特性の複数のフィルタを持つ構
成とし、閾値を変更する毎に複数のフィルタの選択を切
替えるフィルタ選択部とを設けたので、閾値を変更して
も2値画像中の文字パタンの線幅等が変化しない場合に
も、フィルタ特性で文字認識に適した文字パタンを形成
できるので、高精度な文字認識が可能になる。
As described in detail above, first to first
According to the first aspect of the present invention, there is provided a photoelectric conversion unit, a multi-valued data buffer, a binarization circuit, a filter unit, and a recognition circuit. In an optical character reading apparatus for recognizing characters by re-recognition processing after performing conversion and re-filtering, the filter unit has a configuration having a plurality of filters having different filter characteristics. And a filter selection unit that switches the selection of the filter. Therefore, even if the line width of the character pattern in the binary image does not change even if the threshold value is changed, a character pattern suitable for character recognition can be obtained with the filter characteristics. Since it can be formed, highly accurate character recognition becomes possible.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の第1の実施形態を示すOCRの構成図
である。
FIG. 1 is a configuration diagram of an OCR according to a first embodiment of the present invention.

【図2】従来のOCRの要部を示す構成図である。FIG. 2 is a configuration diagram showing a main part of a conventional OCR.

【図3】図2の認識制御を示すフローチャートである。FIG. 3 is a flowchart showing the recognition control of FIG. 2;

【図4】平均線幅の算出の説明図である。FIG. 4 is an explanatory diagram of calculating an average line width.

【図5】2値化閾値による文字パタンの変化の説明図で
ある。
FIG. 5 is an explanatory diagram of a change in a character pattern according to a binarization threshold.

【図6】図2の課題の説明図である。FIG. 6 is an explanatory diagram of the problem in FIG. 2;

【図7】図1の認識制御を示すフローチャートである。FIG. 7 is a flowchart showing the recognition control of FIG. 1;

【図8】図1のフィルタの選択の説明図である。FIG. 8 is an explanatory diagram of selection of a filter in FIG. 1;

【図9】フィルタ処理の概念の説明図である。FIG. 9 is an explanatory diagram of the concept of filter processing.

【図10】フィルタ処理の計算方法を示す図である。FIG. 10 is a diagram illustrating a calculation method of a filtering process.

【図11】フィルタ処理の適用例を示す図である。FIG. 11 is a diagram illustrating an application example of a filtering process.

【図12】本発明の第2の実施形態を示すOCRの構成
図である。
FIG. 12 is a configuration diagram of an OCR according to a second embodiment of the present invention.

【図13】図12のフィルタの選択の説明図である。13 is an explanatory diagram of selection of the filter in FIG.

【図14】本発明の第3の実施形態を示すOCRの構成
図である。
FIG. 14 is a configuration diagram of an OCR according to a third embodiment of the present invention.

【図15】図14のフィルタの選択の説明図である。FIG. 15 is an explanatory diagram of the selection of the filter in FIG. 14;

【図16】本発明の第4の実施形態を示すOCRの構成
図である。
FIG. 16 is a configuration diagram of an OCR according to a fourth embodiment of the present invention.

【図17】図16のフィルタの選択の説明図である。FIG. 17 is an explanatory diagram of selection of the filter in FIG. 16;

【図18】本発明の第5の実施形態を示すOCRの構成
図である。
FIG. 18 is a configuration diagram of an OCR according to a fifth embodiment of the present invention.

【図19】図18のフィルタの選択の説明図である。FIG. 19 is an explanatory diagram of selection of the filter in FIG. 18;

【図20】本発明の第6の実施形態を示すOCRの構成
図である。
FIG. 20 is a configuration diagram of an OCR according to a sixth embodiment of the present invention.

【図21】図20のフィルタの選択の説明図である。FIG. 21 is an explanatory diagram of selection of the filter in FIG. 20;

【図22】本発明の第7の実施形態を示すOCRの構成
図である。
FIG. 22 is a configuration diagram of an OCR according to a seventh embodiment of the present invention.

【図23】図22のフィルタの選択の説明図である。FIG. 23 is an explanatory diagram of selection of the filter in FIG. 22;

【図24】本発明の第8の実施形態を示すOCRの構成
図である。
FIG. 24 is a configuration diagram of an OCR according to an eighth embodiment of the present invention.

【図25】図24のフィルタの選択の説明図である。FIG. 25 is an explanatory diagram of selection of the filter in FIG. 24;

【図26】本発明の第9の実施形態を示すOCRの構成
図である。
FIG. 26 is a configuration diagram of an OCR according to a ninth embodiment of the present invention.

【図27】図26のフィルタの選択の説明図である。FIG. 27 is an explanatory diagram of selection of the filter in FIG. 26;

【図28】本発明の第10の実施形態を示すOCRの構
成図である。
FIG. 28 is a configuration diagram of an OCR according to a tenth embodiment of the present invention.

【図29】図28のフィルタの選択の説明図である。FIG. 29 is an explanatory diagram of the selection of the filter in FIG. 28.

【符号の説明】[Explanation of symbols]

11 光電変換部 12 多値データバッファ 13 2値化回路 14,31,33,35,37,39,41,43,4
5,47フィルタ選択部 15 フィルタ部 15−1〜15−n フィルタ 16 認識部 16−1 2値データバッファ 16−2,32,34,36,38,40,42,4
4,46,48認識回路 17 制御部
Reference Signs List 11 photoelectric conversion unit 12 multi-value data buffer 13 binarization circuit 14, 31, 33, 35, 37, 39, 41, 43, 4
5, 47 filter selection unit 15 filter unit 15-1 to 15-n filter 16 recognition unit 16-1 binary data buffer 16-2, 32, 34, 36, 38, 40, 42, 4
4, 46, 48 recognition circuit 17 control unit

Claims (11)

【特許請求の範囲】[Claims] 【請求項1】 文字が記入された帳票の画像を光学的に
取り込むと共に該画像を光電変換し、該帳票の画像を多
値階調で表す多値データを生成する光電変換部と、 前記多値データを格納する多値データバッファと、 前記多値データバッファから読出した多値データを設定
された閾値で2値化し、前記帳票に対応する2値画像を
生成する2値化回路と、 前記2値化回路の出力する2値画像に対してフィルタ処
理を施して該2値画像中の文字パタンを整形するフィル
タ部と、 前記フィルタ処理された2値画像に対して認識処理を行
って前記文字を認識する認識回路とを備え、 前記認識回路で前記文字を認識できない場合には、前記
閾値を変更した前記2値化と再度の前記フィルタ処理と
を行った上で該認識回路による再認識処理で前記文字を
認識する光学式文字読取装置において、 前記フィルタ部は、前記2値化回路の生成した2値画像
中の文字パタンを異なるフィルタ特性でそれぞれ整形す
る複数のフィルタを持つ構成とし、 前記閾値を変更する毎に前記複数のフィルタの選択を切
替えるフィルタ選択部を設け、 前記閾値を変更する毎に前記選択されたフィルタで前記
フィルタ処理を行って前記再認識処理を行う構成にした
ことを特徴とする光学式文字読取装置。
A photoelectric conversion unit that optically captures an image of a form on which characters are written, photoelectrically converts the image, and generates multi-value data representing the image of the form in multi-valued gradation; A multi-level data buffer for storing value data; a binarization circuit for binarizing the multi-level data read from the multi-level data buffer with a set threshold to generate a binary image corresponding to the form; A filter unit that performs a filtering process on a binary image output from the binarization circuit to shape a character pattern in the binary image, and performs a recognition process on the filtered binary image, And a recognition circuit for recognizing the character. If the character cannot be recognized by the recognition circuit, re-recognition by the recognition circuit after performing the binarization with the threshold changed and the filter processing again Processing recognizes the characters In the optical character reading device, the filter unit is configured to have a plurality of filters for respectively shaping a character pattern in a binary image generated by the binarization circuit with different filter characteristics, and each time the threshold value is changed A filter selection unit for switching the selection of the plurality of filters is provided, and the re-recognition process is performed by performing the filter process with the selected filter every time the threshold value is changed. Character reader.
【請求項2】 前記フィルタ選択部は、前記再認識処理
の回数に基づき前記フィルタ部の複数のフィルタを選択
する構成としたことを特徴とする請求項1記載の光学式
文字読取装置。
2. The optical character reading device according to claim 1, wherein the filter selection unit is configured to select a plurality of filters of the filter unit based on the number of times of the re-recognition processing.
【請求項3】 前記フィルタ選択部は、前記変更する閾
値に基づき前記フィルタ部の複数のフィルタを選択する
構成としたことを特徴とする請求項1記載の光学式文字
読取装置。
3. The optical character reading device according to claim 1, wherein the filter selection unit is configured to select a plurality of filters of the filter unit based on the threshold value to be changed.
【請求項4】 前記フィルタ選択部は、前記2値画像中
の文字パタンの複雑度に基づき前記フィルタ部の複数の
フィルタを選択する構成としたことを特徴とする請求項
1記載の光学式文字読取装置。
4. The optical character according to claim 1, wherein the filter selection unit is configured to select a plurality of filters of the filter unit based on the complexity of a character pattern in the binary image. Reader.
【請求項5】 前記フィルタ選択部は、前記2値画像中
の文字パタンの平均線幅に基づき前記フィルタ部の複数
のフィルタを選択する構成としたことを特徴とする請求
項1記載の光学式文字読取装置。
5. The optical system according to claim 1, wherein the filter selection unit is configured to select a plurality of filters of the filter unit based on an average line width of a character pattern in the binary image. Character reader.
【請求項6】 前記フィルタ選択部は、前記再認識処理
の回数と前記変更する閾値とに基づき前記フィルタ部の
複数のフィルタを選択する構成としたことを特徴とする
請求項1記載の光学式文字読取装置。
6. The optical system according to claim 1, wherein the filter selection unit is configured to select a plurality of filters of the filter unit based on the number of times of the re-recognition processing and the threshold value to be changed. Character reader.
【請求項7】 前記フィルタ選択部は、前記2値画像中
の文字パタンの線幅と該文字パタンの複雑度とに基づき
前記フィルタ部の複数のフィルタを選択する構成とした
ことを特徴とする請求項1記載の光学式文字読取装置。
7. The filter selecting unit is configured to select a plurality of filters of the filter unit based on a line width of a character pattern in the binary image and a complexity of the character pattern. The optical character reading device according to claim 1.
【請求項8】 前記フィルタ選択部は、前記再認識処理
の回数と前記2値画像中の文字パタンの複雑度とに基づ
き前記フィルタ部の複数のフィルタを選択する構成とし
たことを特徴とする請求項1記載の光学式文字読取装
置。
8. The filter selecting unit is configured to select a plurality of filters of the filter unit based on the number of times of the re-recognition processing and the complexity of a character pattern in the binary image. The optical character reading device according to claim 1.
【請求項9】 前記フィルタ選択部は、前記再認識処理
の回数と前記2値画像中の文字パタンの平均線幅とに基
づき前記フィルタ部の複数のフィルタを選択する構成と
したことを特徴とする請求項1記載の光学式文字読取装
置。
9. The filter selecting unit is configured to select a plurality of filters of the filter unit based on the number of times of the re-recognition processing and an average line width of a character pattern in the binary image. The optical character reader according to claim 1.
【請求項10】 前記フィルタ選択部は、前記変更する
閾値と前記2値画像中の文字パタンの平均線幅とに基づ
き前記フィルタ部の複数のフィルタを選択する構成とし
たことを特徴とする請求項1記載の光学式文字読取装
置。
10. The apparatus according to claim 1, wherein the filter selecting unit selects a plurality of filters of the filter unit based on the threshold value to be changed and an average line width of a character pattern in the binary image. Item 1. The optical character reading device according to Item 1.
【請求項11】 前記フィルタ選択部は、前記変更する
閾値と前記2値画像中の文字パタンの複雑度とに基づき
前記フィルタ部の複数のフィルタを選択する構成とした
ことを特徴とする請求項1記載の光学式文字読取装置。
11. The apparatus according to claim 1, wherein the filter selecting unit selects a plurality of filters of the filter unit based on the threshold value to be changed and a complexity of a character pattern in the binary image. 2. The optical character reader according to 1.
JP9173385A 1997-06-30 1997-06-30 Optical character reader read Withdrawn JPH1125221A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9173385A JPH1125221A (en) 1997-06-30 1997-06-30 Optical character reader read

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9173385A JPH1125221A (en) 1997-06-30 1997-06-30 Optical character reader read

Publications (1)

Publication Number Publication Date
JPH1125221A true JPH1125221A (en) 1999-01-29

Family

ID=15959427

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9173385A Withdrawn JPH1125221A (en) 1997-06-30 1997-06-30 Optical character reader read

Country Status (1)

Country Link
JP (1) JPH1125221A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007233836A (en) * 2006-03-02 2007-09-13 Konica Minolta Medical & Graphic Inc Character recognizing method and photographing device
JP2015522877A (en) * 2012-06-07 2015-08-06 アマゾン・テクノロジーズ、インコーポレイテッド Adaptive threshold processing for image recognition.
US9536161B1 (en) 2014-06-17 2017-01-03 Amazon Technologies, Inc. Visual and audio recognition for scene change events

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007233836A (en) * 2006-03-02 2007-09-13 Konica Minolta Medical & Graphic Inc Character recognizing method and photographing device
JP2015522877A (en) * 2012-06-07 2015-08-06 アマゾン・テクノロジーズ、インコーポレイテッド Adaptive threshold processing for image recognition.
US9536161B1 (en) 2014-06-17 2017-01-03 Amazon Technologies, Inc. Visual and audio recognition for scene change events

Similar Documents

Publication Publication Date Title
EP1456816B1 (en) Apparatus and method for recognizing code
US6160913A (en) Method and apparatus for digital halftone dots detection and removal in business documents
EP0713329A1 (en) Method and apparatus for automatic image segmentation using template matching filters
US8395813B2 (en) Subtractive color method, subtractive color processing apparatus, image forming apparatus, and computer-readable storage medium for computer program
JP6056468B2 (en) Image processing apparatus and computer program
JPH02196565A (en) Picture binarizing system
JP3772262B2 (en) How to identify the type of an image
JPH1125221A (en) Optical character reader read
JP2011096095A (en) Image processing system, image processing server, image forming apparatus and image recognition processing method
JPH10222602A (en) Optical character reading device
JP2972500B2 (en) Resolution adaptive control device
JP4228905B2 (en) Image processing apparatus and program
JP2002157552A (en) Optical character reader
JPH0540848A (en) Area extraction method for document image
JP3584478B2 (en) Binarization processing apparatus and binarization processing method
JPH06274691A (en) Character recognizing device
JP3791129B2 (en) Image identification device
JP2878695B2 (en) Image processing apparatus and multi-value image estimation method
JP3240389B2 (en) Binarization processing device
JP2771045B2 (en) Document image segmentation method
EP0369596A1 (en) Discriminating regions of an image
JPH1125223A (en) Character reader
KR0136120B1 (en) Method to retrieve half tone image
JPH09223230A (en) Dither mask discriminating device, dither picture correcting device and character recognizing device
JPH10143608A (en) Character reading device

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20040907