JPH09114925A - Optical character reader - Google Patents

Optical character reader

Info

Publication number
JPH09114925A
JPH09114925A JP7269796A JP26979695A JPH09114925A JP H09114925 A JPH09114925 A JP H09114925A JP 7269796 A JP7269796 A JP 7269796A JP 26979695 A JP26979695 A JP 26979695A JP H09114925 A JPH09114925 A JP H09114925A
Authority
JP
Japan
Prior art keywords
character
character pattern
pattern
white
black
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP7269796A
Other languages
Japanese (ja)
Inventor
Kazumune Kanai
一宗 金井
Yoshikazu Kobayashi
美和 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP7269796A priority Critical patent/JPH09114925A/en
Publication of JPH09114925A publication Critical patent/JPH09114925A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

PROBLEM TO BE SOLVED: To recognize a void character without preparing a character dictionary for void. SOLUTION: An image input means 1 inputs a document image containing the void character to an image memory 2, and a line segmenting means 3 segments the document image in unit of line and inputs it to a line memory 4. A character pattern segmenting means 5 segments a character pattern unit of one character and inputs it to a character pattern memory 6. From the distribution value and width of the character pattern, a void character pattern judging means 7 judges whether that character pattern is a void pattern or not and when the character pattern is a void pattern, it is inputted to a void character pattern memory 8. From the distribution value and width of the character pattern and the distribution value and width of a character absent pattern distribution value memory 9, an inverted character pattern segmenting means 10 segments inverted character pattern and a character pattern white/ black inverting means 12 inverts white and black. A character recognizing means 13 performs character recognition.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、光学式字読取装置
に関するものであり、特に白抜き文字を読み取る装置に
関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an optical character reading device, and more particularly to a device for reading blank characters.

【0002】[0002]

【従来の技術】従来、このような分野の技術としては、
例えば、次のような文献に記載されるものがあった。 文献;特開平1−279385号公報 一般の光学式文字読取装置における文字認識では、例え
ば、白地の用紙に黒で印刷、記入された文字を1文字単
位に切出し、切出した文字パタンを辞書と照合して、文
字を認識する。一方、黒地に白で印刷、記入された文字
から文字パタン切り出しを行う装置として、前記文献に
開示されているものがある。図2は、文書パタンの例を
示す図である。図2に示すような黒の輪郭内に描かれた
白抜き文字(“2”、“3”等)を読取る場合には、一
般の光学式文字認識装置では、このパタンの認識辞書を
用意する必要がある。また、前記文献の装置では、黒い
紙上に書かれた白い文字のように反転文字を読む装置で
あり、図2に示すような白い紙に書かれた白抜き文字を
読むことはできない。
2. Description of the Related Art Conventionally, techniques in such a field include:
For example, some documents were described in the following documents. Reference: Japanese Unexamined Patent Publication No. 1-279385 In character recognition in a general optical character reading device, for example, black characters are printed on a white background paper, entered characters are cut out character by character, and the cut out character patterns are collated with a dictionary. And recognize the character. On the other hand, there is an apparatus disclosed in the above document as an apparatus for cutting out a character pattern from a character printed and written in white on a black background. FIG. 2 is a diagram showing an example of a document pattern. When reading white characters (“2”, “3”, etc.) drawn in a black outline as shown in FIG. 2, a general optical character recognition apparatus prepares a recognition dictionary for this pattern. There is a need. Further, the device of the above-mentioned document is a device for reading a reverse character like a white character written on a black paper, and cannot read an outlined character written on a white paper as shown in FIG.

【0003】[0003]

【発明が解決しようとする課題】しかしながら、従来の
光学式文字認識装置においては、図2に示すような白抜
き文字を読み取る場合には、以下のような問題点があっ
た。図2に示すような白抜き文字を読取る場合、一般の
光学式文字認識装置では、前述したように、この文字パ
タンの認識辞書を用意する必要があり、認識辞書の容量
が膨大になる。また、前記文献の装置では、前述したよ
うに、図2に示すような白い紙上に書かれた白抜き文字
を読み込むことはできない。
However, the conventional optical character recognizing device has the following problems when reading a white character as shown in FIG. When reading a white character as shown in FIG. 2, in a general optical character recognition device, as described above, it is necessary to prepare a recognition dictionary for this character pattern, and the capacity of the recognition dictionary becomes enormous. Further, as described above, the apparatus of the above-mentioned document cannot read white characters written on a white paper as shown in FIG.

【0004】[0004]

【課題を解決するための手段】第1の発明は、前記課題
を解決するために、地色が白又はドロップアウトカラー
の用紙に書かれた文書のイメージを画像メモリへ入力す
る画像入力手段と、前記画像メモリへ入力された文書の
イメージに基づいて、1文字の文字パタンを切り出す文
字パタン切出し手段と、認識辞書を参照して、前記切出
された1文字の文字パタンを認識する文字パタン識別手
段とを、備えた光学式文字読取装置において、以下の手
段を設けている。すなわち、前記文字パタンが所定形状
の黒の輪郭内に描かれた白抜き文字パタンであるか否か
を判別する白抜き文字パタン判別手段と、複数の輪郭内
が全て黒の文字無し白抜き文字パタンのデータをあらか
じめ記録しておく文字無しパタン分布値メモリと、前記
文字無しパタン分布値メモリに記録された文字無し白抜
き文字パタンと前記白抜き文字パタンとを比較して、前
記白抜き文字パタンに対応する文字無し白抜きパタンを
選び、前記白抜き文字パタンと該白抜き文字パタンに対
応する文字無し白抜きパタンとに基づいて、前記白抜き
文字パタンを含む領域の反転文字パタンを切出す反転文
字パタン切出し手段と、前記反転文字パタンの白を黒
へ、黒を白へ画像を反転する文字パタン白/黒反転手段
とを設けている。そして、前記文字パタン認識識別手段
は、白抜き文字パタンの場合は、前記文字パタン白/黒
反転手段により反転された文字パタンから文字認識をす
る構成にしている。従って、前記課題を解決できるので
ある。
In order to solve the above problems, the first invention is image input means for inputting an image of a document written on a paper whose ground color is white or dropout color to an image memory. A character pattern cutout means for cutting out a character pattern of one character based on the image of the document input to the image memory, and a character pattern for recognizing the cutout character pattern of one character by referring to a recognition dictionary. In the optical character reading device provided with the identification means, the following means are provided. That is, a white character pattern determining means for determining whether or not the character pattern is a white character pattern drawn in a black contour of a predetermined shape, and a white character without a character in which a plurality of contours are all black. Characterless pattern distribution value memory in which pattern data is recorded in advance, and the characterless white character pattern and the white character pattern recorded in the characterless pattern distribution value memory are compared, and the white character is compared. Select a blank characterless pattern corresponding to the pattern, and based on the blank character pattern and the blank characterless pattern corresponding to the blank character pattern, cut the reverse character pattern of the area including the blank character pattern. A reverse character pattern cutout unit for outputting and a character pattern white / black reversal unit for reversing the image of the reversed character pattern white to black and black to white are provided. In the case of a white character pattern, the character pattern recognition / identification means is configured to perform character recognition from the character pattern reversed by the character pattern white / black reversing means. Therefore, the above problem can be solved.

【0005】[0005]

【発明の実施の形態】第1の実施形態 図1は、本発明の第1の実施形態を示す光学式文字読取
装置の機能ブロック図である。本第1の実施形態の光学
式文字読取装置が従来の光学式文字読取装置と異なる点
は、地色が白又はドロップアウトカラーの用紙に書かれ
た白抜き文字を読取るために、文字パタンが白抜き文字
であるか否かを判別する白文字パタン判別手段7、白抜
き文字パタンを格納する白抜き文字パタンメモリ8、輪
郭が黒の文字無し白抜きパタンのデータを記録しておく
文字無しパタン分布値メモリ9、反転文字パタンを切出
す反転文字パタン切出し手段10、反転文字パタンを格
納する反転文字パタンメモリ11と、黒を白へ画像を反
転する文字パタン白/黒反転手段12とを設けたことで
ある。図1に示すように、本第1の実施形態の光学式文
字読取装置は、画像入力手段1、画像メモリ2、行切出
し手段3、行メモリ4、文字パタン切出し手段5、文字
パタンメモリ6、白抜き文字パタン判別手段7、白抜き
文字パタンメモリ8、文字無しパタン分布値メモリ9、
反転文字パタン切出し手段10、反転文字パタンメモリ
11、文字パタン白/黒反転手段12、及び文字パタン
認識手段13により構成されている。画像入力手段1
は、地色が白又はドロップアウトカラーの用紙に書かれ
た文字イメージを画像メモリ2へ入力するものであり、
行切出し手段3は、各行を切出して、その行のパタンを
行メモリ4へ入力するものである。
BEST MODE FOR CARRYING OUT THE INVENTION First Embodiment FIG. 1 is a functional block diagram of an optical character reading apparatus showing a first embodiment of the present invention. The optical character reading device according to the first embodiment is different from the conventional optical character reading device in that the character pattern is different in order to read white characters written on a paper whose background color is white or dropout color. White character pattern determining means 7 for determining whether or not a character is a white character, a white character pattern memory 8 for storing a white character pattern, a character with a black outline, and a character for recording data of a white character A pattern distribution value memory 9, an inverted character pattern cutout means 10 for cutting out an inverted character pattern, an inverted character pattern memory 11 for storing an inverted character pattern, and a character pattern white / black inversion means 12 for inverting an image from black to white. It is provided. As shown in FIG. 1, the optical character reader according to the first embodiment includes an image input unit 1, an image memory 2, a line cutout unit 3, a line memory 4, a character pattern cutout unit 5, a character pattern memory 6, Outline character pattern discrimination means 7, outline character pattern memory 8, no-character pattern distribution value memory 9,
The reverse character pattern cutout unit 10, the reverse character pattern memory 11, the character pattern white / black inversion unit 12, and the character pattern recognition unit 13 are included. Image input means 1
Is for inputting a character image written on a paper whose ground color is white or dropout color to the image memory 2.
The line cut-out means 3 cuts out each line and inputs the pattern of the line to the line memory 4.

【0006】文字パタン切出し手段5は、行メモリ4内
の各行について、1文字ずつ文字パターンを切出し、文
字パタンメモリ6へ入力するものである。白抜き文字パ
タン判別手段7は、文字パタンメモリ6内の各文字の文
字パタンが白抜き文字であるか否かを判別して、白抜き
文字であれば、その白抜き文字パタンを白抜き文字パタ
ンメモリ8へ入力するものである。文字無しパタン分布
値メモリ9は、複数の文字無し白抜きパタンのデータを
記録するメモリであり、反転文字パタン切出し手段10
は、白抜きパタンの領域を含む反転文字パタンを切出し
て、その反転文字パタンを反転文字パタンメモリ11に
入力すものであり、文字パタン白/黒反転手段12は、
反転文字パタンの白を黒へ、黒を白へ画像を反転するも
のである。以下、図1の動作の説明をする。画像入力手
段1は、図2に示すような白抜き文字を含む文書イメー
ジを、例えば、白を“0”、黒を“1”に2値化して、
画像メモリ2へ入力する。行切出し手段3は、文書イメ
ージを行単位に切出し、行メモリ4へ入力する。文字パ
タン切出し手段5は、行メモリ4に格納された行単位の
文書イメージから、1文字単位の文字パタンを切出し文
字パタンメモリ6に入力する。
The character pattern cutout means 5 cuts out a character pattern for each character in each line in the line memory 4 and inputs it to the character pattern memory 6. The white character pattern discriminating means 7 judges whether or not the character pattern of each character in the character pattern memory 6 is a white character, and if it is a white character, the white character pattern is the white character. The data is input to the pattern memory 8. The characterless pattern distribution value memory 9 is a memory for recording the data of a plurality of characterless white patterns, and the reverse character pattern cutting means 10 is provided.
Is to cut out a reversed character pattern including a blank pattern area and input the reversed character pattern into the reversed character pattern memory 11, and the character pattern white / black reversing means 12 is
The image of the reverse character pattern is reversed from white to black and from black to white. Hereinafter, the operation of FIG. 1 will be described. The image input means 1 binarizes a document image including white characters as shown in FIG. 2 into, for example, white “0” and black “1”,
Input to the image memory 2. The line cutout unit 3 cuts out the document image line by line and inputs it to the line memory 4. The character pattern cutout unit 5 cuts out a character pattern in units of one character from the document image stored in the line memory 4 in units of lines and inputs it to the character pattern memory 6.

【0007】以上述べた、 (a) 画像入力手段1で白抜き文字の文書イメージを
画像メモリ2へ入力する処理 (b) 行切出し手段3で文書イメージを行単位に切出
しメモリ4へ入力する処理 (c) 文字パタン切出し手段5で行単位のイメージか
ら1文字単位の文字パタンを切出し文字パタンメモリ6
へ入力する処理 の(a)〜(c)の処理は、従来技術によって実施でき
る。従来技術の例として、特開平03−248288号
公報などがある。図3は、(a)〜(c)を経て切り出
された文字パタンの例を示す図であり、図中の破線は、
各切り出された文字の範囲を示している。この文字パタ
ンが文字パタンメモリ6に入力されている。以下の説明
では、文字パタンメモリ6上で黒領域を1、白領域を0
と仮定する。白抜きパタン判別手段7は、文字パタンを
横軸(以下、X軸と記す)、及び縦軸(以下、Y軸と記
す)に投影して、各x、及びyにおける黒画素の個数を
表す分布値を求める。点xにおける分布値をB
X (x)、点yにおける分布値をBY(y)と定義す
る。BX (x)>0を満たすxのうちで最小値をxs
最大値をxe と定義する。また、BY (y)>0を満た
すyのうちで最大値をys 、最小値をye と定義する。
X方向、Y方向の分布値の幅を、|xe −xs |=
x 、|ys −ye |=Dy と定義する。
As described above, (a) the process of inputting the document image of white characters to the image memory 2 by the image input means (b) the process of inputting the document image line by line by the line cutout means 3 into the cutout memory 4. (C) The character pattern cutting means 5 cuts out a character pattern for each character from an image for each line, and a character pattern memory 6 is provided.
The processes (a) to (c) of the process of inputting to can be implemented by conventional techniques. As an example of the conventional technique, there is JP-A 03-248288. FIG. 3 is a diagram showing an example of a character pattern cut out through (a) to (c), and a broken line in the figure indicates
The range of each extracted character is shown. This character pattern is input to the character pattern memory 6. In the following description, the black area is 1 and the white area is 0 on the character pattern memory 6.
Assume that The outline pattern determining means 7 projects the character pattern on the horizontal axis (hereinafter referred to as the X axis) and the vertical axis (hereinafter referred to as the Y axis) to represent the number of black pixels at each x and y. Calculate the distribution value. The distribution value at the point x is B
The distribution value at X (x) and point y is defined as B Y (y). Of x that satisfies B X (x)> 0, the minimum value is x s ,
The maximum value is defined as x e . Further, of y satisfying B Y (y)> 0, the maximum value is defined as y s and the minimum value is defined as y e .
The width of the distribution values in the X and Y directions is | x e −x s | =
It is defined as D x , | y s −y e | = D y .

【0008】図4は、白抜き文字“2”の場合の白抜き
文字パタンのX軸及びY軸への投影図である。各文字パ
タンに対して、以下の2つの処理1−1,1−2を実施
する。 処理1−1:適当に設定された値DxsとDysについて、
次条件を満たす文字パタンを白抜き文字候補とし、満た
さない文字パタンは白抜き文字ではないとする。ただ
し、DxsとDysは白抜き文字ならば必ず次条件1を満た
し、白抜き文字以外の文字は次条件1を満たす数が最小
になるように設定する。 条件1−1:Dx >Dxs(≧でも良い)且つDy >Dys
(≧0でも良い) 図5(a)〜(c)は、白抜き文字パタン判別手段の処
理内容を示す図であり、特に同図(a)は、白抜き文字
“2”のX軸及びY軸の投影図、同図(b)は“4”の
X軸及びY軸の投影図、及び同図(c)は“問”のX軸
及びY軸の投影図である。
FIG. 4 is a projection view of the outline character pattern for the outline character "2" on the X-axis and the Y-axis. The following two processes 1-1 and 1-2 are performed for each character pattern. Process 1-1: For appropriately set values D xs and D ys ,
Character patterns that satisfy the following conditions are defined as outline character candidates, and character patterns that do not satisfy the following are not outline characters. However, D xs and D ys are set so that the following condition 1 is always satisfied if the character is a white character, and the number of characters other than the white character satisfying the next condition 1 is the minimum. Condition 1-1: D x > D xs (≧ may be satisfied) and D y > D ys
(It may be ≧ 0) FIGS. 5A to 5C are diagrams showing the processing contents of the outline character pattern determining means, and in particular, FIG. 5A shows the X axis of the outline character “2” and The Y-axis projection view, FIG. 6B is the X-axis and Y-axis projection view of “4”, and FIG. 6C is the X-axis and Y-axis projection view of “Q”.

【0009】例えば、図5(a)に示す白抜き文字
“2”、及び図5(c)に示す“問”の文字パタンが条
件1−1を満たせば、図5(a)及び5(c)のパタン
が白抜き文字候補となる。処理1−1の結果として、白
抜き文字候補となったパタンに対して、以下の処理1−
2を実施する。 処理1−2:説明上、文字パタンメモリ上でX軸上の1
ビットの幅をΔx、Y軸上の1ビットの幅をΔyと定義
する。適当に設定された値Nx、Ny、δx,δyにつ
いて次条件2を満たす文字パタンを白抜き文字とし、満
たさない文字ならば白抜き文字ではないとする。ただ
し、NxとNyは白抜き文字ならば必ず条件を満たし、
白抜き文字以外のもじは満たす数が最小になるように設
定する。δxとδyは画像入力時のノイズ等を考慮して
決める微小値である。 条件1−2: |BX (xs +nx Δx)−BX (xe −nx e Δx)|<δx (nx =0,1,…,NX ) (≦でも良い) |BY (ys −ny Δy)−BY (ye +ny Δy)|<δy (ny =0,1,…,Ny ) (≦でも良い) この条件1−2は、白抜き文字の場合は、その輪郭がほ
ぼ左右、及び上下対称となることに基づいている。図5
で(a)と(c)のパタンのうち、(a)のみ条件2を
満たせば、(a)のパタンが白抜き文字として選ばれる
ことになる。
For example, if the white character "2" shown in FIG. 5 (a) and the character pattern of "question" shown in FIG. 5 (c) satisfy the condition 1-1, the patterns shown in FIGS. The pattern of c) becomes a blank character candidate. As a result of processing 1-1, the following processing 1-
Perform Step 2. Process 1-2: For explanation, 1 on the X-axis on the character pattern memory
The bit width is defined as Δx, and the 1-bit width on the Y axis is defined as Δy. Character patterns that satisfy the following condition 2 for appropriately set values Nx, Ny, δx, and δy are white characters, and if they do not satisfy the following conditions, the white characters are not white characters. However, if Nx and Ny are blank characters, the condition must be met,
Set so that the number of fills other than the outline characters is the minimum. δx and δy are minute values determined in consideration of noise and the like at the time of image input. Condition 1-2: | B X (x s + n x Δx) −B X (x e −n xe Δx) | <δ x (n x = 0, 1, ..., N X ) (may be ≦) | BY (y s -n y Δy) -B Y (y e + n y Δy) | <δy (n y = 0,1, ..., N y) ( good ≦ even) this condition 1-2, the white character The case is based on the fact that the contour is substantially left-right and vertically symmetrical. FIG.
In the patterns (a) and (c), if only the condition (a) satisfies the condition 2, the pattern (a) will be selected as a blank character.

【0010】このようにして、各文字パタンについて、
処理1−1と処理1−2を順次行うことで、文字パタン
切出し手段5で切出したパタンが白抜き文字かどうかを
判別することができる。処理1−1と処理1−2の結
果、白抜き文字パタンではないと判別されると、そのパ
タンは文字パタン認識手段13へ入力され、白抜き文字
パタンであると判別されると、そのパタンは白抜き文字
パタンメモリ8に入力される。処理1−1と処理1−2
とを逆にして、最初に処理1−2を実施して、次に処理
1−1を実施してもよい。反転文字パタン切出し手段9
は、図4に示すように、白抜き文字パタンメモリ8から
白抜き文字パタンを入力し、それをX軸とY軸に投影し
て分布値を求める。投影される領域に黒画素が無いと分
布値は0となる。点xにおける分布値をBX (x)、点
yにおける分布値をBY (y)と定義する。BX (x)
>0を満たすxのうち最小値をxs 、最大値をxe と定
義する。BY (y)>0を満たすyのうち最小値を
e 、最大値をys と定義する。分布値の幅Dx =|x
e −xs|、Dy =|ys −ye |と定義する。
In this way, for each character pattern,
By sequentially performing the processing 1-1 and the processing 1-2, it is possible to determine whether the pattern cut out by the character pattern cutting means 5 is a blank character. As a result of processing 1-1 and processing 1-2, if it is determined that the character pattern is not a blank character pattern, the pattern is input to the character pattern recognition means 13, and if it is determined that the character pattern is a blank character pattern, the pattern is input. Is input to the blank character pattern memory 8. Process 1-1 and process 1-2
Inversely, the process 1-2 may be performed first, and then the process 1-1 may be performed. Reverse character pattern cutout means 9
As shown in FIG. 4, a white character pattern is input from the white character pattern memory 8 and projected on the X and Y axes to obtain a distribution value. If there are no black pixels in the projected area, the distribution value will be zero. The distribution value at the point x is defined as B X (x), and the distribution value at the point y is defined as B Y (y). B X (x)
Of x satisfying> 0, the minimum value is defined as x s and the maximum value is defined as x e . Of y that satisfies B Y (y)> 0, the minimum value is defined as y e and the maximum value is defined as y s . Width of distribution value D x = | x
It is defined as e −x s |, D y = | y s −y e |.

【0011】図6は、文字無しパタン分布値メモリの内
容を示す図である。あらかじめ、文字無しの白抜き文字
(輪郭内が全部黒)が記入された媒体を用意し、それを
画像入力手段1で読み取らせ、図6に示すようにX軸、
Y軸に投影した結果の分布値Bx '(x)(xs ' ≦x≦
e ' )、BY '(y)(ye ' ≦y≦ys ' )と分布の
幅Dx ' ,Dy ' を求めて、その値を文字無しパタン分
布値メモリ10に記録しておく。図7(a)〜(c)
は、第1の実施形態の反転文字パタン切出し手段の処理
内容を説明するための図である。例えば、図7(a)の
ような真円の文字無しパタン、同図(b)のような正方
形の文字パタン、同図(c)に示すような長方形のパタ
ンを文字無しパタン分布値メモリ10に記録したと仮定
する。文字パタンメモリと文字無しパタン分布値メモリ
でX軸上とY軸上での1ビット当りの幅をそれぞれΔx
とΔyと定義する。以下に述べる処理2−1と処理2−
2により、白抜き文字パタン判別手段から出力された白
抜き文字パタンに対応する文字無しの白抜き文字パタン
を文字を文字無しパタン分布値メモリ10に記録されて
いるパタンから選ぶ。
FIG. 6 is a diagram showing the contents of the characterless pattern distribution value memory. A medium on which white characters without characters (the outline is all black) is written in advance is read by the image input means 1, and the X-axis, as shown in FIG.
Distribution value B x '(x) (x s ' ≤x≤
x e '), B Y ' (y) (y e '≤ y ≤ y s ') and the distribution widths D x 'and D y ' are recorded and the values are recorded in the characterless pattern distribution value memory 10. Keep it. FIGS. 7A to 7C
FIG. 6 is a diagram for explaining the processing contents of the reverse character pattern cutout unit of the first embodiment. For example, a perfect circle character-less pattern as shown in FIG. 7A, a square character pattern as shown in FIG. 7B, and a rectangular pattern as shown in FIG. Suppose you have recorded in. The width per bit on the X-axis and Y-axis is Δx in the character pattern memory and the character-less pattern distribution value memory, respectively.
And Δy. Process 2-1 and Process 2-described below
2, the character-free white character pattern corresponding to the white character pattern output from the white character pattern determining means is selected from the patterns recorded in the characterless pattern distribution value memory 10.

【0012】処理2−1:文字無しパタン分布値メモリ
10に記録されているパタンの中から適当に設定された
値DxnとDynについて次条件2−1を満たすパタンを候
補として選ぶ。 条件2−1: |Dx −Dx ' |<Dxn (|Dx −Dx ' |≦Dxnでも良い) |Dy −Dy ' |<Dyn (|Dy −Dy ' |≦Dynでも良い) この条件2−1は、文字無しパタンの輪郭の大きさが、
入力された文字パタンの輪郭とほぼ同じで大きさである
ことを示している。例えば、図7で(a),(b),
(c)のパタンの中で(a)と(b)が上条件を満た
し、(c)が満たさなければ、(a)と(b)のパタン
が候補として選ばれる。処理2−1の結果として、候補
として選ばれたパタンに対して、処理2−2を実施す
る。 処理2−2:適当に設定された値Nx2、Ny2、δx2、δ
y2に対して、次条件2−2及び2−3を満たす文字パタ
ンを選ぶ。
Process 2-1: From the patterns recorded in the characterless pattern distribution value memory 10, a pattern satisfying the following condition 2-1 for appropriately set values D xn and D yn is selected as a candidate. Conditions 2-1: | D x -D x ' | <D xn (| D x -D x' | may be ≦ D xn) | D y -D y '| <D yn (| D y -D y' | ≦ D yn is also acceptable) The condition 2-1 is that the size of the contour of the characterless pattern is
It indicates that the size is almost the same as the outline of the input character pattern. For example, in FIG. 7, (a), (b),
In the patterns of (c), if (a) and (b) satisfy the above conditions and (c) does not, the patterns of (a) and (b) are selected as candidates. As a result of the process 2-1, the process 2-2 is performed on the pattern selected as the candidate. Process 2-2: Appropriately set values N x2 , N y2 , δ x2 , δ
For y2 , a character pattern that satisfies the following conditions 2-2 and 2-3 is selected.

【0013】条件2−2: |Bx (xs +nx Δx)−Bx '(xs ' +nx Δx)|<δx2 (nx =0,1,2,…Nx2) 且つ |Bx (xe −nx Δx)−Bx '(xe ' −nx Δx)|<δx2 (nx =0,1,2,…Nx2) 且つ |By (ys −ny Δy)−By '(ys ' −ny Δy)|<δy2 (ny =0,1,2,…Ny2) 且つ |By (ye +ny Δy)−By '(ye ' +ny Δy)|<δy2 (ny =0,1,2,…Ny2) Nx2とNy2の値は後述のxds、xde、yds、ydeに対し
て、次の条件2−3を満たすなるべく大きい値を設定す
る。
Condition 2-2: │B x (x s + n x Δx) -B x '(x s ' + n x Δx) │ <δ x 2 (n x = 0,1,2, ... N x2 ) and | B x (x e -n x Δx ) -B x '(x e' -n x Δx) | <δx 2 (n x = 0,1,2, ... n x2) and | B y (y s -n y Δy) -B y '(y s' -n y Δy) | <δy 2 (n y = 0,1,2, ... n y2) and | B y (y e + n y Δy) -B y' ( y e '+ n y Δy) | <δy 2 (n y = 0,1,2, ... n y2) n values of x2 and n y2 are below the x ds, x de, y ds , relative y de, A value as large as possible that satisfies the following condition 2-3 is set.

【0014】条件2−3: xs +Nx2Δx<xds 且つ xde<xe −Nx2Δx 且つ yds<ys −Ny2Δy 且つ ye +Ny2Δy<yde ここで、δx2 とδy2 は画像入力時のノイズ等を考慮
して決める微小値である。条件2−2は、白抜き文字パ
タンの中で反転文字パタンが現れる、または反転文字パ
タンが終わってからの左右、上下の輪郭に対応する文字
無しパタンの輪郭がほぼ同じであることに基づいてい
る。例えば、図7の(a)と(b)のうちで、(a)の
パタンが条件2−2を満たすとすると(a)のパタンが
白抜き文字パタン判別手段から出力された白抜き文字パ
タンに対応する文字無しの白抜きパタンとして選ばれ
る。
Condition 2-3: x s + N x2 Δx <x ds and x de <x e −N x2 Δx and y ds <y s −N y2 Δy and y e + N y2 Δy <y de where δx 2 And δy 2 are minute values determined in consideration of noise at the time of image input. Condition 2-2 is based on the fact that a reversed character pattern appears in the outline character pattern or that the outlines of the characterless patterns corresponding to the left, right, upper and lower contours after the end of the reversed character pattern are almost the same. There is. For example, in FIGS. 7A and 7B, if the pattern of (a) satisfies the condition 2-2, the pattern of (a) is the outline character pattern output from the outline character pattern determining means. It is selected as a white pattern without characters corresponding to.

【0015】以上のようにして、処理2−1と処理2−
2とを順次行うことで、白抜き文字パタン判別手段7か
ら出力された白抜き文字パタンに対応する文字無しの白
抜き文字パタンを選ぶことができる。また、処理2−1
と処理2−2の順序を逆にして、初めに処理2−2を実
施して、次に処理2−1を実施しても結果は同じであ
る。次に、反転文字切出し手段9は、以下の処理によっ
て反転文字パタンを切り出す。図8(a),(b)は、
反転文字パタン切出し手段の処理内容を示す図であり、
図8(a)中のXd は|BX (x)−BX '(x)|を縦
方向に示したときのそのx座標を表し、Yd は|B
Y (y)−BY '(y)|を横方向に示したときのそのy
座標を表す。白抜き文字パタン判別手段7から出力さ
れ、白抜き文字パタンメモリ8に格納されている各白抜
き文字パタンの分布値BX (x)、BY (y)と処理2
−1、処理2−2の結果選ばれた文字無しの白抜き文字
パタンの分布値BX ' (x)、BY ' (y)の差を求め
る。
As described above, the processing 2-1 and the processing 2-
By sequentially performing 2 and 2, it is possible to select a blank character pattern without characters corresponding to the blank character pattern output from the blank character pattern determining means 7. In addition, processing 2-1
The result is the same even if the process 2-2 is first performed and then the process 2-1 is performed by reversing the order of the process 2-2. Next, the reverse character cutout unit 9 cuts out a reverse character pattern by the following processing. 8 (a) and (b),
It is a diagram showing the processing contents of the reverse character pattern cutout means,
In FIG. 8A, X d represents the x coordinate when | B X (x) −B X '(x) | is shown in the vertical direction, and Y d is | B.
Y (y) -B Y '( y) | its y when showing laterally
Indicates coordinates. The distribution values B X (x) and B Y (y) of each white character pattern output from the white character pattern discriminating means 7 and stored in the white character pattern memory 8 and the process 2
-1, The difference between the distribution values B X ′ (x) and B Y ′ (y) of the white character pattern without characters selected as a result of processing 2-2 is obtained.

【0016】画像入力時のノイズ等の原因による分布値
の誤差を除去する為に、あらかじめしきい値THxdとT
Hydを適当な値に設定しておく。そして、図8(a)に
示すように、|BX (x)−BX '(x)|>THxd(≧
でも良い)を満たすxのうち最小値をxds、最大値をx
deと定義する。|BY (y)−BY '(y)|>THyd
(≧でも良い)を満たすyのうち最大値をyds、最小値
をydeと定義する。これは、白抜き文字パタンは、対応
する文字無いパタンとは、白抜き文字パタンの領域の濃
度が異なるので、分布値|BX (x)−BX '(x)|、
|BY (y)−BY '(y)|がしきい値を越えるような
x座標、又はy座標に反転文字パタンが存在するからで
ある。図8(b)に示すように、始点を(xs
s )、終点を(xe ,ye )とする矩形領域と始点を
(xds,yds)、終点を(xde,yde)とする矩形領域
を白抜き文字パタン上に設定し、外側の矩形領域と内側
の矩形領域の間の領域は、白(ビット値は0)と、内側
の矩形領域は黒(ビット値は1)とANDを取る。
In order to eliminate an error in the distribution value due to noise or the like at the time of image input, the threshold values THxd and Tx are previously set.
Set Hyd to an appropriate value. Then, as shown in FIG. 8A, | B X (x) −B X '(x) |> THxd (≧
However , the minimum value of x that satisfies
Define as de . │B Y (y) -B Y '(y) | > THyd
Of y satisfying (≧), the maximum value is defined as y ds and the minimum value is defined as y de . This is because the outline character pattern has a different density in the area of the outline character pattern from the corresponding non-character pattern, so the distribution value | B X (x) −B X '(x) |,
| Because reversed character pattern in the x-coordinate or y-coordinate that exceeds the threshold is present | B Y (y) -B Y '(y). As shown in FIG. 8B, the starting point is (x s ,
y s ), the end point is (x e , y e ), the start point is (x ds , y ds ), and the end point is (x de , y de ). The area between the outer rectangular area and the inner rectangular area is ANDed with white (bit value is 0) and the inner rectangular area is black (bit value is 1).

【0017】図9(a),(b)は、反転文字パタン切
出し手段9の処理結果を示す図である。その結果、図9
(a),(b)に示すように、白抜き文字パタンに外接
する矩形領域に囲まれた領域の白抜き文字パタンが得ら
れる。そして、それを反転文字パタンメモリ11に記録
する。文字パタン白/黒反転手段12は、各白抜き文字
パタンについて、始点を(xds,yds)、終点を
(xde,yde)とする矩形領域を反転文字パタンメモリ
11上に設定し、この領域の中の0と1と反転する。図
10は、文字パタン白/黒反転手段12の処理結果を示
す図である。図10に示すように、文字パタン白/黒反
転手段12により文字パタン認識手段13で認識できる
パタンが得られる。文字パタン認識手段13は、白抜き
文字パタンであれば、反転文字パタンメモリ10から反
転文字パタンを読み出し、認識辞書を参照して、文字パ
タン認識を行い、白抜き文字パタンでなければ、文字パ
タンメモリ6から文字パタンを読み出し、文字認識を行
う。
FIGS. 9A and 9B are views showing the processing result of the reverse character pattern cutout means 9. As a result, FIG.
As shown in (a) and (b), an outline character pattern of an area surrounded by a rectangular area circumscribing the outline character pattern is obtained. Then, it is recorded in the reverse character pattern memory 11. The character pattern white / black reversing means 12 sets a rectangular area having a start point (x ds , y ds ) and an end point (x de , y de ) on the reverse character pattern memory 11 for each white character pattern. , 0 and 1 in this area are inverted. FIG. 10 is a diagram showing a processing result of the character pattern white / black inverting means 12. As shown in FIG. 10, the character pattern white / black inverting means 12 provides a pattern which can be recognized by the character pattern recognizing means 13. The character pattern recognition unit 13 reads the reversed character pattern from the reversed character pattern memory 10 if it is a blank character pattern, performs character pattern recognition by referring to the recognition dictionary, and if it is not a blank character pattern, the character pattern is recognized. The character pattern is read from the memory 6 and the character is recognized.

【0018】以上説明したように、本第1の実施形態に
よれば、白抜き文字用認識辞書を用意することなしに、
白抜きパタンと白抜き文字パタン以外の文字パタンの混
在している文字パタンから白抜き文字パタンを判別し、
その白抜き文字以外の文字パタンの混在している文字パ
タンから白抜き文字パタンを判別し、その白抜き文字パ
タン認識手段で認識可能な文字パタン認識手段で認識可
能な文字パタンに変換することができるので、白抜き文
字用認識辞書を作成することがなく、辞書の容量が削減
できるという利点がある。
As described above, according to the first embodiment, there is no need to prepare a white character recognition dictionary.
The white character pattern is distinguished from the character pattern in which the white pattern and the character patterns other than the white character pattern are mixed,
It is possible to determine a white character pattern from a character pattern in which character patterns other than the white character are mixed and convert it to a character pattern that can be recognized by the white character pattern recognition means. Therefore, there is an advantage that the dictionary capacity can be reduced without creating a white character recognition dictionary.

【0019】第2の実施形態 図11は、本発明の第2の実施形態を示す光学式文字読
取装置の機能ブロック図であり、図1中の要素に共通す
る要素には共通の符号を付してある。本発明の第2の実
施形態の白抜き文字認識装置が第1の実施形態の白抜き
文字認識装置と異なる点は、図1中の文字無しパタン分
布値メモリ11を用いずに、反転パタン切出し手段20
は、白抜きパタンの分布値BX (x)、BY (y)の勾
配から反転パタンの切出しを行うようにしたことであ
る。以下、図11の動作の説明をする。第1の実施形態
と同様にして、画像入力手段1は、図3に示すような白
抜き文字を含む文書イメージを、例えば、白を“0”、
黒を“1”に2値化して、画像メモリ2へ入力し、行切
出し手段3は、文書イメージを行単位に切出し、行メモ
リ4へ入力する。そして、文字パタン切出し手段5は、
行メモリ4に格納された行単位の文書イメージから、1
文字単位の文字パタンを切出し文字パタンメモリ6に入
力する。白抜き文字パタン判別手段7は、文字パタンが
白抜き文字パタンであるか否かを判別して、白抜き文字
パタンを白抜き文字パタンメモリ8へ入力する。
Second Embodiment FIG. 11 is a functional block diagram of an optical character reader according to a second embodiment of the present invention. Elements common to those in FIG. 1 are designated by common reference numerals. I am doing it. The outline character recognition device according to the second embodiment of the present invention is different from the outline character recognition device according to the first embodiment in that it does not use the characterless pattern distribution value memory 11 in FIG. Means 20
In other words, the inversion pattern is cut out from the gradient of the white pattern distribution values B X (x) and B Y (y). The operation of FIG. 11 will be described below. Similar to the first embodiment, the image input unit 1 extracts a document image including white characters as shown in FIG.
The black is binarized to "1" and input to the image memory 2, and the line cutout unit 3 cuts out the document image line by line and inputs it to the line memory 4. Then, the character pattern cutting means 5 is
From the line-by-line document image stored in the line memory 4, 1
A character pattern for each character is input to the cut-out character pattern memory 6. The outline character pattern determining means 7 determines whether the character pattern is an outline character pattern and inputs the outline character pattern to the outline character pattern memory 8.

【0020】図12(a),(b)は、第2の実施形態
の反転文字パタン切出し手段20の処理内容を示す図で
ある。反転文字パタン切出し手段20は、白抜き文字パ
タンを図4に示すように、X軸とY軸に投影して分布値
を求める。投影される領域に黒画素が無いと分布値は0
となる。点xにおける分布値をBX (x)、点yにおけ
る分布値をBY (y)と定義する。BX (x)>0を満
たすxのうち最小値をxs 、最大値をxe と定義する。
Y (y)>0を満たすyのうち最大値をys 、最小値
をye と定義する。次に、図12(a)、(b)に示す
ように、xs とxe の中点(xs +xe )/2とys
e の中点(ys +ye )/2を求める。白抜き文字パ
タンメモリ8上でX軸の1ビットの幅をΔx、Y軸上の
1ビットの幅をΔyと定義する。また、反転文字パタン
を求める為に勾配として最適な値BXn(>0)とB
Yn(>0)を設定しておく。
FIGS. 12A and 12B are views showing the processing contents of the reverse character pattern cutout means 20 of the second embodiment. The reverse character pattern cutout unit 20 projects a white character pattern on the X axis and the Y axis to obtain a distribution value, as shown in FIG. If there are no black pixels in the projected area, the distribution value is 0.
Becomes The distribution value at the point x is defined as B X (x), and the distribution value at the point y is defined as B Y (y). Of x that satisfies B X (x)> 0, the minimum value is defined as x s and the maximum value is defined as x e .
Among y satisfying B Y (y)> 0, the maximum value is defined as y s and the minimum value is defined as y e . Next, FIG. 12 (a), the (b), the midpoint of x s and x e (x s + x e ) / 2 and y s and y e midpoint (y s + y e) / 2 Ask for. On the outline character pattern memory 8, the 1-bit width on the X-axis is defined as Δx, and the 1-bit width on the Y-axis is defined as Δy. In addition, the optimum values B Xn (> 0) and B as the gradient for obtaining the reverse character pattern
Set Yn (> 0).

【0021】図12(a)に示すように、xs ≦x<
(xs +xe )/2の範囲で、BX (x−Δx)−BX
(x)>BXnを満たす最小のxをxdsと定義する。(x
s +xe )/2≦x≦xe の範囲で、BX (x+Δx)
−BX (x)>BXnを満たす最大のxをxdeと定義す
る。また、図12(b)に示すように、(ys +ye
/2≦y<ys の範囲で、BY (y+Δy)−B
Y (y)>BYnを満たす最大のyをydsと定義する。y
e≦y≦(ys +ye )/2の範囲で、BY (y−Δ
y)−BX (y)>BYnを満たす最小のyをydeと定義
する。これは、白抜き文字パタンの反転文字パタンのX
軸、Y軸上の始点、終点において、反転文字パタンによ
り黒が少なくなり、隣接する輪郭との間で一定以上の勾
配を持つことに基づいている。始点を(xs ,ys )、
終点を(xe ,ye )とする矩形領域と始点を(xds
ds)、終点を(xde,yde)とする矩形領域を白抜き
文字パタン上に設定し、外側の矩形領域と内側の矩形領
域の間の領域は、白(ビット値は0)と、内側の矩形領
域は黒(ビット値は1)とANDを取る。
As shown in FIG. 12 (a), x s ≤x <
In the range of (x s + x e ) / 2, B X (x−Δx) −B X
The minimum x that satisfies (x)> B Xn is defined as x ds . (X
s + x e ) / 2 ≦ x ≦ x e , B X (x + Δx)
The maximum x that satisfies −B X (x)> B Xn is defined as x de . Further, as shown in FIG. 12 (b), (y s + y e)
/ 2 ≦ y <in the range of y s, B Y (y + Δy) -B
The maximum y satisfying Y (y)> B Yn is defined as y ds . y
in the range of e ≦ y ≦ (y s + y e) / 2, B Y (y-Δ
The minimum y that satisfies y) −B X (y)> B Yn is defined as y de . This is the reverse character pattern X of the blank character pattern.
It is based on the fact that black is reduced due to the reverse character pattern at the start point and the end point on the axis and the Y-axis, and there is a certain or greater gradient between adjacent contours. The starting point is (x s , y s ),
A rectangular area whose end point is (x e , y e ) and whose start point is (x ds ,
y ds ), a rectangular area whose end point is (x de , y de ) is set on the outline character pattern, and the area between the outer rectangular area and the inner rectangular area is white (bit value is 0). , The inner rectangular area is ANDed with black (the bit value is 1).

【0022】文字パタン白/黒反転手段12は、各白抜
き文字パタンについて、始点を(xds,yds)、終点を
(xde,yde)とする矩形領域を反転文字パタンメモリ
11上に設定し、この領域の中の0と1と反転する。文
字パタン認識手段13は、白抜き文字パタンであれば、
反転文字パタンメモリ10から反転文字パタンを読み出
し、認識辞書を参照して、文字パタン認識を行い、白抜
き文字パタンでなければ、文字パタンメモリ6から文字
パタンを読み出し、文字認識を行う。以上説明したよう
に、第2の実施形態によれば、第1の実施形態と同様の
利点がある。なお、本発明は、上記実施形態に限定され
ず種々の変形が可能である。その変形例としては、例え
ば次のようなものがある。
The character pattern white / black reversing means 12 creates a rectangular area in the reversed character pattern memory 11 with respect to each white character pattern as a rectangular area having a start point (x ds , y ds ) and an end point (x de , y de ). , And 0 and 1 in this area are inverted. If the character pattern recognition means 13 is a white character pattern,
The reversed character pattern is read from the reversed character pattern memory 10, the character pattern is recognized by referring to the recognition dictionary, and if it is not a blank character pattern, the character pattern is read from the character pattern memory 6 and the character is recognized. As described above, according to the second embodiment, there are the same advantages as the first embodiment. Note that the present invention is not limited to the above embodiment, and various modifications are possible. For example, there are the following modifications.

【0023】(1) 白抜き文字は、白と黒に2値化で
きるものであれば、用紙の色は、白でもドロップアウト
カラーでも何でも良い。 (2) 図13は、白抜き文字パタンの輪郭の例を示す
図である。第1及び第2の実施形態では、切出す白抜き
文字の背景の輪郭の形を限定(真円)したが、輪郭の形
と大きさが、以下(a)、(b)であれば図13に示す
ように、多様な形の背景(輪郭)の白抜き文字に適用す
ることができる。 (a) 白抜き文字パタン判別手段7の処理で白抜き文
字パタンと白抜き文字以外のパタンに判別できる形と大
きさであること。 (b) 第1の実施形態の反転文字パタン切出し手段1
0の処理で白抜き文字パタン判別手段から出力された白
抜き文字パタンに対応する文字無し白抜き文字パタンを
文字無しパタン分布値メモリに記録されている複数の文
字無し白抜き文字パタンの分布値と分布の幅から、1つ
だけを選び出すことができるように相互に差がある形と
大きさであること、又は白抜き文字の輪郭内を全部黒と
仮定しても、第2の実施形態の反転文字パタン切出し手
段20を実施しても、xds、xde、yds、ydeが定まら
ない形と大きさであること。 (3) 第1の実施形態の文字無しパタン分布値メモリ
9には、同一の形状の文字無し白抜きパタンは、1個の
み記録しておき、入力された白抜きパタンの始点
(xs ,ys )に対して、その文字無しパタンの始点
(xs ' ,ys ' )がその始点に一致するように文字無
しパタンを平行移動してから、入力された白抜きパタン
と比較するようにしてもよい。
(1) The outline character may be white or dropout color as long as it can be binarized into white and black. (2) FIG. 13 is a diagram showing an example of the outline of an outline character pattern. In the first and second embodiments, the contour shape of the background of the cut-out white character is limited (a perfect circle), but if the contour shape and size are (a) and (b) below, As shown in FIG. 13, it can be applied to outline characters of various shapes (outline). (A) The shape and size are such that the white character pattern determining means 7 can distinguish between a white character pattern and a pattern other than the white character. (B) Reversed character pattern cutout means 1 of the first embodiment
In the processing of 0, the characterless white character pattern corresponding to the white character pattern output from the white character pattern discriminating means is defined as a characterless white character pattern distribution value. Even if it is assumed that the shapes and sizes differ from each other so that only one can be selected from the width of the distribution and the width of the distribution, or that the outline of the outline character is all black, the second embodiment X ds , x de , y ds , y de must have a shape and size that cannot be determined even if the reverse character pattern cutout means 20 is executed. (3) In the characterless pattern distribution value memory 9 of the first embodiment, only one characterless blank pattern having the same shape is recorded, and the starting point (x s , relative y s), the starting point of the character without pattern (x s ', y s' ) is a character without patterns to match its starting point after translation, to compare the inputted white pattern You may

【0024】[0024]

【発明の効果】以上詳細に説明したように、第1〜第5
の発明によれば、白抜き文字パタン判別手段、反転文字
パタン切出し手段、及び文字パタン白/黒反転手段を設
けたので、白抜き文字用認識辞書を作成することがな
く、辞書の容量が削減ができる。
As described in detail above, the first to fifth embodiments
According to the invention, since the white character pattern discriminating means, the reverse character pattern cutting means, and the character pattern white / black reversing means are provided, it is not necessary to create a white character recognition dictionary, and the dictionary capacity is reduced. You can

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の第1の実施形態の光学式文字読取装置
の機能ブロック図である。
FIG. 1 is a functional block diagram of an optical character reading device according to a first embodiment of the present invention.

【図2】文書パタンの例を示す図である。FIG. 2 is a diagram showing an example of a document pattern.

【図3】切り出された文字パタンの例を示す図である。FIG. 3 is a diagram showing an example of a cut-out character pattern.

【図4】白抜き文字パタンのX軸及びY軸への投影図で
ある。
FIG. 4 is a projection view of white character patterns on the X axis and the Y axis.

【図5】白抜き文字パタン判別手段の処理内容を示す図
である。
FIG. 5 is a diagram showing the processing contents of an outline character pattern determination means.

【図6】文字無しパタン分布値メモリの内容を示す図で
ある。
FIG. 6 is a diagram showing the contents of a characterless pattern distribution value memory.

【図7】第1の実施形態の反転文字パタン切出し手段の
処理内容を示す図である。
FIG. 7 is a diagram illustrating processing contents of a reverse character pattern cutout unit according to the first embodiment.

【図8】反転文字パタン切出し手段の処理内容を示す図
である。
FIG. 8 is a diagram showing processing contents of a reverse character pattern cutout unit.

【図9】反転文字パタン切出し手段の処理結果を示す図
である。
FIG. 9 is a diagram showing a processing result of a reverse character pattern cutout unit.

【図10】文字パタン白/黒反転手段の処理結果を示す
図である。
FIG. 10 is a diagram showing a processing result of a character pattern white / black inverting means.

【図11】本発明の第2の実施形態の光学式文字読取装
置の機能ブロック図である。
FIG. 11 is a functional block diagram of an optical character reading device according to a second embodiment of the present invention.

【図12】第2の実施形態の反転文字パタン切出し手段
の処理内容を示す図である。
FIG. 12 is a diagram illustrating processing contents of a reverse character pattern cutout unit according to the second embodiment.

【図13】白抜き文字パタンの輪郭の例を示す図であ
る。
FIG. 13 is a diagram showing an example of the outline of an outline character pattern.

【符号の説明】[Explanation of symbols]

1 画像入力手段 2 画像メモリ 3 行切出し手段 4 行メモリ 5 文字パタン切出し手段 6 文字パタンメモリ 7 白抜き文字パタン判別手
段 8 白抜き文字パタンメモリ 9 文字無しパタン分布値メ
モリ 10,20 反転文字パタン切出し手
段 11 反転文字パタンメモリ 12 文字パタン白/黒反転手
段 13 文字パタン認識手段
1 image input means 2 image memory 3 line cutout means 4 line memory 5 character pattern cutout means 6 character pattern memory 7 white character pattern judgment means 8 white character pattern memory 9 no character pattern distribution value memory 10, 20 reverse character pattern cutout Means 11 Reversed character pattern memory 12 Character pattern White / black Reversed means 13 Character pattern recognition means

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 地色が白又はドロップアウトカラーの用
紙に書かれた文書のイメージを画像メモリへ入力する画
像入力手段と、 前記画像メモリへ入力された文書のイメージに基づい
て、1文字の文字パタンを切り出す文字パタン切出し手
段と、 認識辞書を参照して、前記切出された1文字の文字パタ
ンを認識する文字パタン識別手段とを、備えた光学式文
字読取装置において、 前記文字パタンが所定形状の黒の輪郭内に描かれた白抜
き文字パタンであるか否かを判別する白抜き文字パタン
判別手段と、 複数の輪郭内が全て黒の文字無し白抜き文字パタンのデ
ータをあらかじめ記録しておく文字無しパタン分布値メ
モリと、 前記文字無しパタン分布値メモリに記録された文字無し
白抜き文字パタンと前記白抜き文字パタンとを比較し
て、前記白抜き文字パタンに対応する文字無し白抜きパ
タンを選び、前記白抜き文字パタンと該白抜き文字パタ
ンに対応する文字無し白抜きパタンとに基づいて、前記
白抜き文字パタンを含む領域の反転文字パタンを切出す
反転文字パタン切出し手段と、 前記反転文字パタンの白を黒へ、黒を白へ画像を反転す
る文字パタン白/黒反転手段とを設け、 前記文字パタン認識識別手段は、 白抜き文字パタンの場合は、前記文字パタン白/黒反転
手段により反転された文字パタンから文字認識をする構
成にしたことを特徴とする光学式文字読取装置。
1. An image input means for inputting an image of a document written on a paper whose ground color is white or dropout color to an image memory, and one character based on the image of the document input to the image memory. In an optical character reading device including a character pattern cutout unit for cutting out a character pattern and a character pattern identification unit for recognizing the cutout character pattern of one character by referring to a recognition dictionary, the character pattern is A white character pattern determination means for determining whether or not a white character pattern is drawn in a black contour of a predetermined shape, and prerecorded data of a white character pattern without characters in which a plurality of contours are all black Characterless pattern distribution value memory to be stored, comparing the characterless white character pattern and the white character pattern recorded in the characterless pattern distribution value memory, A characterless white pattern corresponding to the blank character pattern is selected, and a reverse character pattern of an area including the blank character pattern is selected based on the blank character pattern and the blank blank pattern corresponding to the blank character pattern. And a character pattern white / black reversing means for reversing an image of the reversed character pattern from white to black and from black to white. In the case of a pattern, the optical character reading device is characterized in that character recognition is performed from the character pattern reversed by the character pattern white / black reversing means.
【請求項2】 地色が白又はドロップアウトカラーの用
紙に書かれた文書のイメージを画像メモリへ入力する画
像入力手段と、 前記画像メモリへ入力された文書のイメージに基づい
て、1文字の文字パタンを切り出す文字パタン切出し手
段と、 認識辞書を参照して、前記切出された1文字の文字パタ
ンを認識する文字パタン識別手段とを、備えた光学式文
字読取装置において、 前記文字パタンが所定形状の黒の輪郭内に描かれた白抜
き文字パタンであるか否かを判別する白抜き文字パタン
判別手段と、 前記白抜き文字パタンを含む領域の反転文字パタンを切
出す反転文字パタン切出し手段と、 前記反転文字パタンの白を黒へ、黒を白へ画像を反転す
る文字パタン白/黒反転手段とを、 設けたことを特徴とする光学式文字読取装置。
2. An image input means for inputting an image of a document written on a paper whose ground color is white or dropout color to an image memory, and one character based on the image of the document input to the image memory. In an optical character reading device including a character pattern cutout unit for cutting out a character pattern and a character pattern identification unit for recognizing the cutout character pattern of one character by referring to a recognition dictionary, the character pattern is White character pattern determining means for determining whether or not a white character pattern is drawn in a black contour of a predetermined shape, and a reverse character pattern cutout for cutting out a reverse character pattern of an area including the white character pattern. An optical character reading device comprising: a means and a character pattern white / black reversing means for reversing an image of the reversed character pattern from white to black and from black to white.
【請求項3】 前記白抜き文字判別手段は、 文字パタンをX軸、及びY軸に投影した黒又は白の画素
の個数を表す分布値BX (x)、BY (y)と、X方
向、及びY方向の分布の幅Dx 、Dy とに基づいて、文
字パタンが白抜き文字か否かを判別することを特徴とす
る請求項1又は2記載の光学式文字読取装置。
3. The white character determining means is a distribution value B X (x), B Y (y) representing the number of black or white pixels obtained by projecting a character pattern on the X axis and the Y axis, and X. 3. The optical character reading device according to claim 1, wherein it is determined whether the character pattern is a white character based on the widths D x and D y of the distribution in the direction and the Y direction.
【請求項4】 前記文字無しパタン分布値メモリは、 複数の輪郭内が全部黒の文字無し白抜きパタンをX軸、
及びY軸に投影した黒又は白の画素の個数を表す分布値
X '(x)、BY '(y)と、X方向、及びY方向の分布
の幅Dx ' 、及びDY ' を記録し、 前記反転文字パタン切出し手段は、 前記白抜き文字パタン判別手段から出力された白抜き文
字パタンの分布値BX(x)、BY (y)と、分布の幅
X 、DY と、前記文字無しパタンメモリに記録されて
いる文字無し白抜きパタンの分布値BX '(x)、BY '
(y)と、分布の幅Dx '(x)、及びDY '(y)とを比較
して、読み取った白抜き文字に対応する文字無し白抜き
パタンの分布値BX '(x)、及びBY ' (y)と幅
x '(x)、及びDY '(y)を1組選び、 前記BX (x)と前記選ばれたBX '(x)との差、及び
前記BY (y)と前記選ばれたBY '(y)との差を求め
た結果から反転文字パタンの領域を求めて反転文字パタ
ンを切出すことを特徴とする請求項1記載の光学式文字
読取装置。
4. The characterless pattern distribution value memory stores a characterless white pattern in which a plurality of contours are all black on the X-axis,
And distribution values B X '(x) and B Y ' (y) representing the number of black or white pixels projected on the Y-axis, and distribution widths D x 'and D Y ' in the X and Y directions. The reverse character pattern cutout means stores the distribution values B X (x) and BY (y) of the white character patterns output from the white character pattern determination means, and the distribution widths D X and D. Y and the distribution value B X '(x), B Y ' of the white characterless pattern recorded in the characterless pattern memory
(y) is compared with the distribution widths D x '(x) and D Y ' (y), and the distribution value B X '(x) of the character-free white pattern corresponding to the read white characters. , B Y ′ (y) and a width D x ′ (x) and D Y ′ (y), and a difference between the B X (x) and the selected B X ′ (x), 2. The reverse character pattern is cut out by obtaining the area of the reverse character pattern from the result of obtaining the difference between the B Y (y) and the selected B Y '(y). Optical character reader.
【請求項5】 前記反転文字パタン切出し手段は、 白抜き文字パタン判別手段から出力された白抜き文字パ
タンの分布値BX (x)、BY (y)の勾配から反転文
字パタンの領域を求めて反転文字パタンを切出すことを
特徴とする請求項2記載の光学式文字読取装置。
5. The inversion character pattern cutout means extracts an area of the inversion character pattern from the gradient of the distribution values B X (x) and B Y (y) of the white character pattern output from the outline character pattern determination means. 3. The optical character reading device according to claim 2, wherein the reversed character pattern is cut out in order to obtain it.
JP7269796A 1995-10-18 1995-10-18 Optical character reader Withdrawn JPH09114925A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7269796A JPH09114925A (en) 1995-10-18 1995-10-18 Optical character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7269796A JPH09114925A (en) 1995-10-18 1995-10-18 Optical character reader

Publications (1)

Publication Number Publication Date
JPH09114925A true JPH09114925A (en) 1997-05-02

Family

ID=17477291

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7269796A Withdrawn JPH09114925A (en) 1995-10-18 1995-10-18 Optical character reader

Country Status (1)

Country Link
JP (1) JPH09114925A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004097721A1 (en) * 2003-04-25 2004-11-11 Sharp Kabushiki Kaisha Image processing device, image processing method, image processing program, and computer-readable recording medium containing the program
JP2010081053A (en) * 2008-09-24 2010-04-08 Fuji Xerox Co Ltd Image processor and image processing program
JP2019204990A (en) * 2018-05-21 2019-11-28 富士ゼロックス株式会社 Information processing apparatus and program

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004097721A1 (en) * 2003-04-25 2004-11-11 Sharp Kabushiki Kaisha Image processing device, image processing method, image processing program, and computer-readable recording medium containing the program
JP2010081053A (en) * 2008-09-24 2010-04-08 Fuji Xerox Co Ltd Image processor and image processing program
JP2019204990A (en) * 2018-05-21 2019-11-28 富士ゼロックス株式会社 Information processing apparatus and program

Similar Documents

Publication Publication Date Title
US7440618B2 (en) Apparatus for extracting rules line from multiple-valued image
US6947596B2 (en) Character recognition method, program and recording medium
US5526440A (en) Hand-written character recognition apparatus
US6297828B1 (en) Line drawing using graphics processing
JPH09114925A (en) Optical character reader
JP2000090194A (en) Image processing method and image processor
US5426712A (en) Method and apparatus for describing a character image based on its contours, and for classifying the character image for character recognition based on a resulting contour-based description of the character image
JPS58197581A (en) Method and device for recognizing character and figure
JP3710164B2 (en) Image processing apparatus and method
JP2894111B2 (en) Comprehensive judgment method of recognition result in optical type character recognition device
JP2008234223A (en) Image processing apparatus, image processing method, program, and recording medium
JP3400154B2 (en) Document image area extraction method and apparatus
JP2755299B2 (en) Image processing method
JPH0728934A (en) Document image processor
JP2762476B2 (en) Copy-writing device
JP2602259B2 (en) Document processing device
JPS62173578A (en) Character recognizing system in scene picture
JP3277977B2 (en) Character recognition method
JPH05174178A (en) Character recognizing method
JPH1021332A (en) Non-linear normalizing method
JPS648873B2 (en)
JPH0773273A (en) Pattern segmenting and recognizing method and its system
JPH10214311A (en) Reader for decorative character
JPH05135204A (en) Character recognition device
JPH1040334A (en) Pattern extracting device and method for segmenting pattern area

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20030107