JPH10240868A - Device for reading character - Google Patents

Device for reading character

Info

Publication number
JPH10240868A
JPH10240868A JP9043904A JP4390497A JPH10240868A JP H10240868 A JPH10240868 A JP H10240868A JP 9043904 A JP9043904 A JP 9043904A JP 4390497 A JP4390497 A JP 4390497A JP H10240868 A JPH10240868 A JP H10240868A
Authority
JP
Japan
Prior art keywords
character
recognition
logical
unit
filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9043904A
Other languages
Japanese (ja)
Inventor
Yuji Hamazaki
祐児 浜崎
Yoshimi Yamada
義美 山田
Hajime Sato
元 佐藤
Susumu Naitsu
将 内津
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP9043904A priority Critical patent/JPH10240868A/en
Publication of JPH10240868A publication Critical patent/JPH10240868A/en
Pending legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)
  • Character Discrimination (AREA)

Abstract

PROBLEM TO BE SOLVED: To improve recognition ratio in a character recognizing device for operating character recognition to a binarized slip image. SOLUTION: An image I1 of a binarized slip 1 is received by a facsimile equipment(FAX) 2, and stored in an image memory 3. A segmenting part 4 segments an area I2 of character units of the slip image. A filter part 10 is provided with five logical filters 11-15 for operating a filtering processing by different rules, and for example, the logical filter 11 is selected and used at first, and then the shaping of a character pattern in the area I2 is operated. A recognizing part 21 operates character recognition to the shaped character pattern. In this case, when the character recognition is impossible, the selection of the logical filters 11-15 is changed by the instruction of a recognition controlling part 22, and the shaping of the character pattern and the character recognition is operated by using the changed logical filter 12. Afterwards, the similar processing is repeated, and the plural number of times of character recognition is operated.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、光学式文字読取装
置(以下、OCRという)等に代表される文字読取装置
に関するものであある。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character reading device represented by an optical character reading device (hereinafter referred to as "OCR").

【0002】[0002]

【従来の技術】従来のOCRは、帳票の画像を多値画像
として取り込み、該多値画像に対して予め設定された閾
値で、濃度に関する二値化を行う。この二値化の結果得
られた二値化画像に対して文字認識を行い、帳票に記入
または印刷されたされた文字を認識してその文字コード
を出力する。従来では、文字認識の認識率を向上するた
めに、最初の文字認識でリジェクト(文字コードが検索
できない事象)が発生すると、二値化の際の閾値を変更
して二値化画像中の文字パタンを変化させ、複数回の文
字認識を行う。これにより、高い文字認識率が得られて
いる。
2. Description of the Related Art A conventional OCR takes an image of a form as a multi-valued image, and binarizes the density of the multi-valued image with a preset threshold value. Character recognition is performed on the binarized image obtained as a result of the binarization, the character written or printed on the form is recognized, and the character code is output. Conventionally, in order to improve the recognition rate of character recognition, when rejection (event in which the character code cannot be searched) occurs in the first character recognition, the threshold for binarization is changed to change the character in the binarized image. Perform character recognition multiple times by changing the pattern. Thereby, a high character recognition rate is obtained.

【0003】[0003]

【発明が解決しようとする課題】しかしながら、従来の
OCRでは、次のような課題があった。最近、ファクシ
ミリ通信された帳票イメージに対する文字認識を行うと
いう需要が増えており、入力手段がファクシミリ装置と
して構成されたOCRが、商品化されている。ところ
が、ファクシミリ装置を介してOCRに入力される画像
データは多値画像ではなく、二値で表された二値画像で
ある。そのため、1回しか文字認識が行われず、文字認
識における認識率が向上できなかった。
However, the conventional OCR has the following problems. Recently, there has been an increasing demand for performing character recognition on a form image transmitted by facsimile communication, and an OCR having an input unit configured as a facsimile apparatus has been commercialized. However, the image data input to the OCR via the facsimile apparatus is not a multi-valued image but a binary image represented by a binary value. Therefore, character recognition is performed only once, and the recognition rate in character recognition cannot be improved.

【0004】[0004]

【課題を解決するための手段】前記課題を解決するため
に、本発明のうちの第1の発明は、文字認識装置におい
て、次のような受信手段、イメージメモリ、切出部、フ
ィルタ部、認識部及び認識制御部を設けている。受信手
段は、二値化された帳票イメージを受信するものであ
る。イメージメモリは、前記帳票イメージを格納するも
のである。切出部は、前記イメージメモリに格納された
帳票イメージから、読取対象の文字パタンを含む領域を
切り出すものである。フィルタ部は、前記領域中の各画
素の値を周辺画素の状況に応じて異なるルールでそれぞ
れ再設定する複数の論理フィルタを有し、該複数の論理
フィルタのうち指示された論理フィルタを用いて該領域
中の文字パタンを整形するものである。認識部は、前記
整形された文字パタンに対する文字認識を行い、該文字
認識で得られた文字コードを出力するものである。そし
て、認識制御部は、前記フィルタ部に対して前記指示を
与える機能と、該指示を与えた結果で前記文字コードが
得られなかった場合に、前記フィルタ部に新たな指示を
出し該フィルタ部で用いる論理フィルタを変更する機能
とを有し、該フィルタ部及び前記認識部における処理を
複数回実行させるものである。
According to a first aspect of the present invention, there is provided a character recognition apparatus comprising: a receiving unit, an image memory, a cutout unit, a filter unit, A recognition unit and a recognition control unit are provided. The receiving means is for receiving the binarized form image. The image memory stores the form image. The cutout unit cuts out an area including a character pattern to be read from the form image stored in the image memory. The filter unit has a plurality of logical filters for resetting the value of each pixel in the area according to different rules according to the situation of peripheral pixels, and uses a designated logical filter among the plurality of logical filters. The character pattern in the area is shaped. The recognition section performs character recognition on the shaped character pattern and outputs a character code obtained by the character recognition. A recognition control unit configured to issue a new instruction to the filter unit when the character code is not obtained as a result of giving the instruction to the filter unit; And a function of changing the logical filter used in the filter unit and causing the filter unit and the recognition unit to execute the process a plurality of times.

【0005】第2の発明は、文字認識装置において、次
のような受信手段、イメージメモリ、切出部、フィルタ
部、認識部及び認識制御部を設けている。受信手段は、
二値化された帳票イメージを受信するものである。イメ
ージメモリは、前記帳票イメージを格納するものであ
る。切出部は、前記イメージメモリに格納された帳票イ
メージから、読取対象の文字パタンを含む領域を切り出
すものである。フィルタ部は、前記領域中の各画素の値
を周辺画素の状況に応じて異なるルールでそれぞれ再設
定する複数の論理フィルタを有し、該複数の論理フィル
タのうち指示された論理フィルタを用いて該領域中の文
字パタンを整形するものである。認識部は、前記整形さ
れた文字パタンに対する文字認識を行い、該文字認識で
得られた文字コード或いは該文字認識で付随して得られ
る該文字パタンに関する情報を出力するものである。認
識制御部は、前記フィルタ部に対して前記指示を与える
機能と、該指示を与えた結果で前記文字コードが得られ
なかった場合に、前記文字パタンに関する情報に応じて
前記フィルタ部に新たな指示を出し該フィルタ部で用い
る論理フィルタを任意に変更する機能とを有し、該フィ
ルタ部及び前記認識部における処理を複数回実行させる
ものである。
According to a second aspect of the present invention, a character recognition device includes the following receiving means, an image memory, a cutout unit, a filter unit, a recognition unit, and a recognition control unit. The receiving means is
The binarized form image is received. The image memory stores the form image. The cutout unit cuts out an area including a character pattern to be read from the form image stored in the image memory. The filter unit has a plurality of logical filters that reset the value of each pixel in the region according to different rules according to the situation of peripheral pixels, and uses a designated logical filter among the plurality of logical filters. The character pattern in the area is shaped. The recognizing unit performs character recognition on the shaped character pattern, and outputs a character code obtained by the character recognition or information on the character pattern accompanying the character recognition. The recognition control unit has a function of giving the instruction to the filter unit, and when the character code is not obtained as a result of giving the instruction, a new function is provided to the filter unit in accordance with the information on the character pattern. A function of issuing an instruction and arbitrarily changing a logical filter used in the filter unit, and causing the filter unit and the recognition unit to execute the process a plurality of times.

【0006】第1及び第2の発明によれば、以上のよう
に文字認識装置を構成したので、イメージメモリに格納
される帳票イメージは、二値で表された二値画像である
が、フィルタ部の論理フィルタを変更することで、認識
対象の文字の文字パタンが変化する。このように変化し
た文字パタンに文字認識を行えば、文字コードが抽出し
やすくなる。認識制御部が、指示を適宜フィルタ部に与
え、論理フィルタを変更するので、複数回の文字認識が
可能になる。従って、前記課題を解決できるのである。
According to the first and second aspects of the present invention, since the character recognition device is configured as described above, the form image stored in the image memory is a binary image represented by a binary image. By changing the logical filter of the part, the character pattern of the character to be recognized changes. If character recognition is performed on the changed character pattern, a character code can be easily extracted. Since the recognition control unit appropriately gives an instruction to the filter unit and changes the logical filter, character recognition can be performed a plurality of times. Therefore, the above problem can be solved.

【0007】[0007]

【発明の実施の形態】図1は、本発明の実施形態を示す
文字認識装置の構成ブロック図である。この文字認識装
置は、帳票1に記入または印刷された文字を認識するも
のであり、受信手段であるファクシミリ装置(FAX)
2を備えている。このファクシミリ装置2には、図示し
ない電話回線等を介して帳票1の二値化されたイメージ
が送られてくる。ファクシミリ装置2の出力側には、該
ファクシミリ装置2を介した帳票1のイメージI1を格
納するイメージメモリ3が接続されている。イメージメ
モリ3の出力側には切出部4が接続され、この切出部4
の出力側に、フィルタ部10が接続されている。論理フ
ィルタ部10の出力側にはパターンメモリ20が接続さ
れている。パターンメモリ20の出力側に認識部21が
接続されている。認識部21は、2つの出力先を持ち、
その一方の出力先がこの文字認識装置の出力端子OUT
になっている。他方の出力先が認識制御部22になって
いる。認識制御部22は、フィルタ部10に指示を与え
る構成になっている。
FIG. 1 is a block diagram showing the configuration of a character recognition apparatus according to an embodiment of the present invention. This character recognition device is for recognizing characters written or printed on a form 1, and is a facsimile device (FAX) as a receiving means.
2 is provided. The binarized image of the form 1 is sent to the facsimile apparatus 2 via a telephone line (not shown). On the output side of the facsimile machine 2, an image memory 3 for storing an image I1 of the form 1 via the facsimile machine 2 is connected. A cutout section 4 is connected to the output side of the image memory 3, and the cutout section 4
The filter unit 10 is connected to the output side of the. The pattern memory 20 is connected to the output side of the logic filter unit 10. The recognition unit 21 is connected to the output side of the pattern memory 20. The recognition unit 21 has two output destinations,
One of the output destinations is an output terminal OUT of the character recognition device.
It has become. The other output destination is the recognition control unit 22. The recognition control unit 22 is configured to give an instruction to the filter unit 10.

【0008】切出部3は、イメージメモリ3に格納され
たイメージから、例えぱ1文字単位の領域I2を切り出
す機能を有している。フィルタ部10は、例えば5個の
論理フィルタ11,12,13,14,15を有してい
る。各論理フィルタ11〜15の入力側が、切出部4の
出力側に接続され、各論理フィルタ11〜15の出力側
がパタンメモリ20の入力側に接続されている。これら
論理フィルタ11〜15は、それぞれ異なるルールで領
域I2中の画素の値を再設定するものである。フィルタ
部10は、認識制御部22からの指示で論理フィルタ1
1〜15のいずれかを選択し、その選択した論理フィル
タの出力する領域のデータをパタンメモリ20に与える
構成になっている。図2は、第1の論理フィルタ11〜
15によるフィルタリング処理を説明する図である。図
2には、隣接する9つの画素X1〜X9が示されてい
る。このうちのX5が注目画素であり、画素X1〜X
4,X6〜X9が周辺画素である。フィルタリング処理
を行う場合、各画素X1〜X9の値を次の(1)式に代
入し、その(1)式を計算した結果と、値Tとを比較し
て注目画素X5の値を設定する。
The extracting section 3 has a function of extracting an area I2 in units of one character, for example, from the image stored in the image memory 3. The filter unit 10 has, for example, five logical filters 11, 12, 13, 14, and 15. The input side of each of the logical filters 11 to 15 is connected to the output side of the extracting unit 4, and the output side of each of the logical filters 11 to 15 is connected to the input side of the pattern memory 20. These logical filters 11 to 15 reset the values of the pixels in the area I2 according to different rules. The filter unit 10 receives the logical filter 1 according to an instruction from the recognition control unit 22.
Any one of 1 to 15 is selected, and the data of the area output by the selected logical filter is provided to the pattern memory 20. FIG. 2 shows the first logical filters 11 to 11.
15 is a diagram for describing filtering processing by No. 15. FIG. FIG. 2 shows nine adjacent pixels X1 to X9. X5 of these is the target pixel, and pixels X1 to X
4, X6 to X9 are peripheral pixels. When performing the filtering process, the values of the pixels X1 to X9 are substituted into the following equation (1), and the result of the calculation of the equation (1) is compared with the value T to set the value of the target pixel X5. .

【0009】[0009]

【数1】 画素X1〜X9が白でその値がすべて“0”の場合に
は、(1)式の計算結果が値Tよりも小さくなり、注目
画素X5の値も“0”の白に設定される。画素X1〜X
9が黒でその値がすべて“1”の場合には、(1)式の
計算結果が例えば値Tよりも大きくなり、注目画素X5
の値も“1”の黒に設定される。このような注目画素の
設定を、論理フィルタ11〜15は領域I2の全画素に
対して行う。ここで、値Tは任意に設定でき、この値T
を変化させることで、フィルタリング処理結果が異な
る。一方、注目画素X5の値に重み付けを行って(1)
式の計算を行うことによっても、フィルタリング処理結
果が異なる。図3(a),(b)は、フィルタリング処
理のルールの具体例を説明する図であり、図4(a),
(b)は、図3(a),(b)による文字パタンの変化
をそれぞれ示す図である。
(Equation 1) When the pixels X1 to X9 are white and their values are all “0”, the calculation result of the expression (1) becomes smaller than the value T, and the value of the target pixel X5 is also set to “0” white. Pixels X1 to X
9 is black and all the values are “1”, the calculation result of the expression (1) becomes larger than the value T, for example, and the target pixel X5
Is also set to "1" black. Such setting of the target pixel is performed by the logical filters 11 to 15 for all the pixels in the region I2. Here, the value T can be set arbitrarily.
, The filtering processing result is different. On the other hand, the value of the target pixel X5 is weighted (1)
The result of the filtering process differs depending on the calculation of the expression. FIGS. 3A and 3B are diagrams for explaining specific examples of the rules of the filtering process.
FIG. 3B is a diagram showing a change in the character pattern according to FIGS. 3A and 3B, respectively.

【0010】各論理フィルタ11〜15は、予め条件と
して与えられたそれぞれ異なるルールで、領域I2に対
するフィルタ処理を行うが、そのルールは、例えば
(1)式における注目画素X5の重み付けと、値Tの設
定値である。図3(a)では、値Tを3とし、注目画素
X5の値を白の場合“0”及び黒の場合“1”にしてい
る。図3(b)では、値Tを5とし、注目画素X5の値
を白の場合“0”及び黒の場合は重み付けして“3”に
している。図3(a)のルールを用いてフィルタリング
処理を行うと、図4(a)のように、文字パタンP1
が、文字パタンP2に変化する。図3(b)のルールを
用いてフィルタリング処理を行うと、図4(b)のよう
に、文字パタンP1が、文字パタンP3に変化する。文
字パタンP2と文字パタンP3とを比較すると、両方と
もノイズN1は除去されるが、その文字の線幅が異な
る。パタンP2の方が、切れがなく、また線幅も良く、
文字認識に適している。各論理フィルタ11〜15は、
注目画素の重み付けと値Tとの組み合わせが異なるよう
に条件付けされ、ルールの異なるフィルタリング処理で
ノイズの除去と文字パタンの平滑化を行うようになって
いる。
Each of the logical filters 11 to 15 performs a filtering process on the area I2 according to different rules given in advance as conditions. The rules include, for example, the weighting of the target pixel X5 in the equation (1) and the value T Is the set value. In FIG. 3A, the value T is set to 3, and the value of the target pixel X5 is set to “0” for white and “1” for black. In FIG. 3B, the value T is set to 5, and the value of the target pixel X5 is set to "0" for white and weighted to "3" for black. When the filtering process is performed using the rule of FIG. 3A, as shown in FIG.
Changes to the character pattern P2. When the filtering process is performed using the rule of FIG. 3B, the character pattern P1 changes to a character pattern P3 as shown in FIG. 4B. When the character pattern P2 and the character pattern P3 are compared, the noise N1 is removed for both, but the line widths of the characters are different. The pattern P2 has no cut and has a good line width,
Suitable for character recognition. Each of the logical filters 11 to 15 is
Conditioning is performed so that the combination of the weight of the target pixel and the value T is different, and noise removal and character pattern smoothing are performed by filtering processing with different rules.

【0011】次に、図1の文字認識装置の動作を説明す
る。ファクシミリ装置2には、通信相手からのファクシ
ミリ信号が与えられる。このファクシミリ信号を受信す
ることによって、帳票1の二値化されたイメージI1が
入力され、そのイメージI1がイメージメモリ3に格納
される。切出部4は、イメージI1から1文字単位の領
域I2を切出す。領域I2には、認識対象の文字パタン
が含まれている。図1の文字認識装置は、この領域I2
に対する最初のの文字認識を行う(以下、1stスキャ
ンという)。1stスキャンでは、認識制御部22から
の指示で、フィルタ部10は論理フィルタ11を選択し
て活性化する。論理フィルタ11は、条件付けされたル
ールでフィルタリング処理を行い、(1)式を用いて領
域I2の各画素を再設定する。これにより、整形された
文字パタンは、パタンメモリ20に格納される。認識部
21が、パタンメモリに格納された文字パタンと辞書と
を比較して文字認識を行う。この1stスキャンの文字
認識で、認識対象文字に対応する文字コードが得られた
場合には、その文字コートが出力端子OUTから出力さ
れる。認識不能で文字コードが抽出できないときには、
認識部21からリジェクト信号が認識制御部22へ与え
られる。
Next, the operation of the character recognition device shown in FIG. 1 will be described. The facsimile device 2 is provided with a facsimile signal from a communication partner. By receiving the facsimile signal, the binarized image I1 of the form 1 is input, and the image I1 is stored in the image memory 3. The extracting unit 4 extracts an area I2 in units of one character from the image I1. The area I2 includes a character pattern to be recognized. The character recognition device shown in FIG.
Is performed for the first time (hereinafter, referred to as 1st scan). In the first scan, the filter unit 10 selects and activates the logical filter 11 according to an instruction from the recognition control unit 22. The logical filter 11 performs a filtering process based on a conditioned rule, and resets each pixel of the region I2 using Expression (1). Thus, the shaped character pattern is stored in the pattern memory 20. The recognizing unit 21 performs character recognition by comparing the character pattern stored in the pattern memory with the dictionary. When the character code corresponding to the character to be recognized is obtained by the character recognition of the first scan, the character code is output from the output terminal OUT. If the character code cannot be extracted because it cannot be recognized,
A reject signal is provided from the recognition unit 21 to the recognition control unit 22.

【0012】リジェクト信号を受けた認識制御部22
は、フィルタ部10に対して新たな指示を与えて2回目
の文字認識処理(2ndスキャン)を実行させる。新た
な指示により、フィルタ部10は論理フィルタ12を選
択して活性化する。論理フィルタ12は、条件付けされ
たルールでフィルタリング処理を行い、(1)式を用い
て領域I2の各画素を再設定する。これにより、整形さ
れた文字パタンは、1stスキャンの場合と同様に、パ
タンメモリ20に格納され、認識部21が、パタンメモ
リに格納された文字パタンと辞書とを比較して文字認識
を行う。この2ndスキャンでも、文字コードが抽出で
きない場合には、以下、1stスキャン及び2ndスキ
ャンと同様に、論理フィルタ13〜15に変更しなが
ら、3〜5回目の認識処理を行う。以上のように、本実
施形態では、フィルタ部10に領域I2中の各画素の値
を周辺画素の状況に応じて異なるルールでそれぞれ再設
定する論理フィルタ11〜15を設け、各スキャンで文
字コードが得られない場合に、その論理フィルタ11〜
15の選択を換えて文字パタンを整形し、複数回の文字
認識を行うようにしている。そのため、与えられた帳票
1のイメージが二値の場合でも、文字認識に適した文字
パタンが得られ、文字認識率を向上できる。
Recognition control unit 22 receiving a reject signal
Gives a new instruction to the filter unit 10 to execute the second character recognition processing (2nd scan). The filter unit 10 selects and activates the logical filter 12 according to the new instruction. The logical filter 12 performs a filtering process according to a conditioned rule, and resets each pixel of the region I2 using Expression (1). As a result, the shaped character pattern is stored in the pattern memory 20 as in the case of the first scan, and the recognition unit 21 performs character recognition by comparing the character pattern stored in the pattern memory with the dictionary. If the character code cannot be extracted by the second scan, the third to fifth recognition processes are performed while changing to the logical filters 13 to 15 as in the first scan and the second scan. As described above, in the present embodiment, the filter unit 10 is provided with the logical filters 11 to 15 that reset the values of the respective pixels in the area I2 according to different rules according to the situation of the peripheral pixels. Are not obtained, the logical filters 11 to
The character pattern is shaped by changing the selection of fifteen, and character recognition is performed a plurality of times. Therefore, even when the given image of the form 1 is binary, a character pattern suitable for character recognition can be obtained, and the character recognition rate can be improved.

【0013】なお、本発明は、上記実施形態に限定され
ず種々の変形が可能である。その変形例としては、例え
ば次のようなものがある。 (1) 論理フィルタ11〜15の数は5個に限らず増
加させてもよい。 (2) 上記実施形態では、論理フィルタ11〜15を
順に選択するようにしているが、認識部21で文字認識
を行ったときに、付随して得られる文字パタンの線幅等
の情報や文字の種類等の情報を認識制御部22にフィー
ドバックし、該情報に応じて、任意の論理フィルタを選
択するようにしてもよい。このようにすることで、スキ
ャンの回数を減じることができ、処理の高速化が実現で
きる。
Note that the present invention is not limited to the above-described embodiment, and various modifications are possible. For example, there are the following modifications. (1) The number of logic filters 11 to 15 is not limited to five and may be increased. (2) In the above embodiment, the logical filters 11 to 15 are sequentially selected. However, when character recognition is performed by the recognition unit 21, information such as the line width of a character pattern and a character obtained along with the character pattern are obtained. May be fed back to the recognition control unit 22, and an arbitrary logical filter may be selected according to the information. By doing so, the number of scans can be reduced, and the processing can be speeded up.

【0014】[0014]

【発明の効果】以上詳細に説明したように、第1及び第
2の発明によれば、二値化された帳票イメージを受信す
る受信手段と、イメージメモリと、切出部及び認識部を
備えた文字認識装置に、複数の論理フィルタを有するフ
ィルタ部と、論理フィルタ部に対して指示を与える機能
と、文字コードが得られなかった場合に、フィルタ部で
用いる論理フィルタを変更する機能とを有する認識制御
部とを設けているので、帳票のイメージが二値で与えら
れても、複数回の文字認識が可能であり、文字認識率が
向上する。
As described above in detail, according to the first and second aspects of the present invention, there are provided a receiving means for receiving a binarized form image, an image memory, a cutout section and a recognition section. A character recognition device, a filter unit having a plurality of logical filters, a function of giving an instruction to the logical filter unit, and a function of changing a logical filter used in the filter unit when a character code is not obtained. Since the recognition control unit is provided, even if the image of the form is given in binary, character recognition can be performed a plurality of times, and the character recognition rate is improved.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施形態を示す文字認識装置の構成ブ
ロック図である。
FIG. 1 is a configuration block diagram of a character recognition device according to an embodiment of the present invention.

【図2】図1の論理フィルタ11〜15によるフィルタ
リング処理を説明する図である。
FIG. 2 is a diagram illustrating filtering processing by logical filters 11 to 15 in FIG. 1;

【図3】フィルタリング処理のルールの具体例を説明す
る図である。
FIG. 3 is a diagram illustrating a specific example of a rule of a filtering process.

【図4】図3による文字パタンの変化を示す図である。FIG. 4 is a diagram showing a change in a character pattern according to FIG. 3;

【符号の説明】[Explanation of symbols]

1 帳票 2 ファクシミリ装置 3 イメージメモリ 4 切出部 10 フィルタ部 11〜15 論理フィルタ 20 パタンメモリ 21 認識部 22 認識制御部 REFERENCE SIGNS LIST 1 form 2 facsimile device 3 image memory 4 cutout unit 10 filter unit 11 to 15 logical filter 20 pattern memory 21 recognition unit 22 recognition control unit

───────────────────────────────────────────────────── フロントページの続き (72)発明者 内津 将 東京都港区虎ノ門1丁目7番12号 沖電気 工業株式会社内 ──────────────────────────────────────────────────の Continuing on the front page (72) Inventor Masaru Uchizu Oki Electric Industry Co., Ltd., 1-7-12 Toranomon, Minato-ku, Tokyo

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 二値化された帳票イメージを受信する受
信手段と、 前記帳票イメージを格納するイメージメモリと、 前記イメージメモリに格納された帳票イメージから、読
取対象の文字パタンを含む領域を切り出す切出部と、 前記領域中の各画素の値を周辺画素の状況に応じて異な
るルールでそれぞれ再設定する複数の論理フィルタを有
し、該複数の論理フィルタのうち指示された論理フィル
タを用いて該領域中の文字パタンを整形するフィルタ部
と、 前記整形された文字パタンに対する文字認識を行い、該
文字認識で得られた文字コードを出力する認識部と、 前記フィルタ部に対して前記指示を与える機能と、該指
示を与えた結果で前記文字コードが得られなかった場合
に、該フィルタ部に新たな指示を出し該フィルタ部で用
いる論理フィルタを変更する機能とを有し、該フィルタ
部及び前記認識部における処理を複数回実行させる認識
制御部とを、 備えたことを特徴とする文字読取装置。
A receiving unit that receives a binarized form image; an image memory that stores the form image; and an area including a character pattern to be read is cut out from the form image stored in the image memory. A cutout unit, comprising a plurality of logical filters for resetting the value of each pixel in the area according to different rules according to the situation of peripheral pixels, using a designated logical filter among the plurality of logical filters A filter unit for shaping a character pattern in the area, performing a character recognition on the shaped character pattern, and outputting a character code obtained by the character recognition; and And a logical instruction to be issued to the filter unit when the character code is not obtained as a result of the instruction. And a function of changing the filter, and a recognition control unit to perform multiple processes in the filter unit and the recognition unit, character reading apparatus characterized by comprising.
【請求項2】 二値化された帳票イメージを受信する受
信手段と、 前記帳票イメージを格納するイメージメモリと、 前記イメージメモリに格納された帳票イメージから、読
取対象の文字パタンを含む領域を切り出す切出部と、 前記領域中の各画素の値を周辺画素の状況に応じて異な
るルールでそれぞれ再設定する複数の論理フィルタを有
し、該複数の論理フィルタのうち指示された論理フィル
タを用いて該領域中の文字パタンを整形するフィルタ部
と、 前記整形された文字パタンに対する文字認識を行い、該
文字認識で得られた文字コード或いは該文字認識で付随
して得られる該文字パタンに関する情報を出力する認識
部と、 前記フィルタ部に対して前記指示を与える機能と、該指
示を与えた結果で前記文字コードが得られなかった場合
に、前記文字パタンに関する情報に応じて前記フィルタ
部に新たな指示を出し該フィルタ部で用いる論理フィル
タを任意に変更する機能とを有し、該フィルタ部及び前
記認識部における処理を複数回実行させる認識制御部と
を、 備えたことを特徴とする文字読取装置
2. A receiving means for receiving a binarized form image, an image memory storing the form image, and cutting out an area including a character pattern to be read from the form image stored in the image memory. A cutout unit, comprising a plurality of logical filters for resetting the value of each pixel in the area according to different rules according to the situation of peripheral pixels, using a designated logical filter among the plurality of logical filters A filter unit for shaping a character pattern in the area by performing character recognition on the shaped character pattern, and information on the character code obtained by the character recognition or the character pattern obtained by the character recognition. And a function for giving the instruction to the filter unit, and when the character code is not obtained as a result of giving the instruction. A function of issuing a new instruction to the filter unit in accordance with the information on the character pattern and arbitrarily changing a logical filter used in the filter unit, and performing a process in the filter unit and the recognition unit a plurality of times. A character reading device, comprising: a control unit;
JP9043904A 1997-02-27 1997-02-27 Device for reading character Pending JPH10240868A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9043904A JPH10240868A (en) 1997-02-27 1997-02-27 Device for reading character

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9043904A JPH10240868A (en) 1997-02-27 1997-02-27 Device for reading character

Publications (1)

Publication Number Publication Date
JPH10240868A true JPH10240868A (en) 1998-09-11

Family

ID=12676707

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9043904A Pending JPH10240868A (en) 1997-02-27 1997-02-27 Device for reading character

Country Status (1)

Country Link
JP (1) JPH10240868A (en)

Similar Documents

Publication Publication Date Title
US4903312A (en) Character recognition with variable subdivisions of a character region
US4757551A (en) Character recognition method and system capable of recognizing slant characters
EP1173003B1 (en) Image processing method and image processing apparatus
JPH07131641A (en) Image processor
JP2011139366A (en) Image processing apparatus and method, and program
JPH05225378A (en) Area dividing system for document image
JPH11272798A (en) Method and device for distinguishing bold character
JPH10240868A (en) Device for reading character
JPH10222602A (en) Optical character reading device
JP3545227B2 (en) Image processing method and apparatus, optical character reader
JPS60153575A (en) Character reading system
JPS58197581A (en) Method and device for recognizing character and figure
JP3681919B2 (en) How to cut out information code
JP3710164B2 (en) Image processing apparatus and method
KR100334624B1 (en) Clustering based document image segmentation method
EP0446630A2 (en) Method and apparatus for segmenting characters in an amount field on a financial document
JP4580520B2 (en) Character recognition method and character recognition apparatus
JPH09114925A (en) Optical character reader
JPH0785221A (en) Method for separating and recognizing character and symbol in automatic drawing recognizing device
JP3277977B2 (en) Character recognition method
JPS63109592A (en) Character recognition system
JP2899356B2 (en) Character recognition device
JP3471925B2 (en) Copying apparatus and image processing method
JP2002354238A (en) Image area separation system and image processing system applying it
JPH11353417A (en) Optical character reader

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20030617