JPH03122786A - Optical character reader - Google Patents

Optical character reader

Info

Publication number
JPH03122786A
JPH03122786A JP1258772A JP25877289A JPH03122786A JP H03122786 A JPH03122786 A JP H03122786A JP 1258772 A JP1258772 A JP 1258772A JP 25877289 A JP25877289 A JP 25877289A JP H03122786 A JPH03122786 A JP H03122786A
Authority
JP
Japan
Prior art keywords
character
pattern
frame
entry frame
contact
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1258772A
Other languages
Japanese (ja)
Other versions
JP2877380B2 (en
Inventor
Toyoshi Sato
佐藤 豊志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP1258772A priority Critical patent/JP2877380B2/en
Publication of JPH03122786A publication Critical patent/JPH03122786A/en
Application granted granted Critical
Publication of JP2877380B2 publication Critical patent/JP2877380B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

PURPOSE:To obtain a proper character reading result by preparing a dictionary for executing the character recognizing processing of a partial character pattern in each contact/extruded state, and when a character is contacted/extruded with/from a frame, executing its character recognizing processing by using the dictionary. CONSTITUTION:A character recognizing circuit 13 executes the character recognizing processing of a character pattern detected by a character segmenting circuit 12 in each character based upon a reference pattern stored in the dictionary memory 14. The memory 14 stores reference patterns for recognizing the character patterns of characters entered so as not to be contacted/extruded with/from respective character entering frames and reference patterns for recognizing partial character patterns (patterns existing in the character entering frames) due to contact/extrusion in each contacted/extruded state with/from each character entering frame. Even when a character entered in the character entering frame is contacted/extruded with/from the frame, its proper character reading result can be obtained.

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、帳票に設けられた非ドロップアウトカラーに
よる文字記入枠内に記入された文字の読取りを行なう光
学的文字読取装置に関する。
[Detailed Description of the Invention] [Objective of the Invention] (Industrial Application Field) The present invention is an optical character reader for reading characters written in a non-dropout color character writing frame provided on a form. Regarding equipment.

(従来の技術) 一般に、帳票に記入された文字を読取る光学的文字読取
装置においては、帳票に設けられた文字記入位置を示す
枠内を文字読取りの対象としている。帳票に設けられた
文字記入位置を示す枠(文字記入枠)が黒い枠(非ドロ
ツプアウトカラ)によって印刷等がされている場合、文
字記入枠内に記入する文字が枠に接触したり、はみ出さ
ないことが文字記入条件となっている。
(Prior Art) Generally, in an optical character reading device that reads characters written on a form, characters are read within a frame provided on the form indicating a position where characters are written. If the frame (character entry frame) that indicates the character entry position provided on the form is printed with a black frame (non-dropout color), the characters written in the character entry frame may touch the frame. , the condition for writing characters is that they do not protrude.

近年では、第2図に示す払込通知票のような、一般の人
によって文字が記録される帳票を、光学的文字読取装置
によって読取りを行なう場合が増えてきている。しかし
ながら、一般の人によって文字の記入が行われるため、
文字が文字記入枠へ接触したり、はみ出して記入される
場合が非常に多くなっている。このような文字が正確に
記入されない場合であっても、そのまま文字認識処理が
実行されてしまう。このため、正確に文字記入枠内に記
入されない文字については、文字認識率が大きく低下し
てしまうことがあった。特に、払込通知票等における口
座番号や、金額等の数字文字データについて誤読すると
大きな問題が生じてしまう。
In recent years, optical character reading devices are increasingly used to read forms on which characters are recorded by ordinary people, such as the payment notice slip shown in FIG. However, since the characters are filled in by ordinary people,
It is very common for characters to touch or extend beyond the character entry frame. Even if such characters are not entered correctly, the character recognition process will continue to be performed. For this reason, the character recognition rate may drop significantly for characters that are not accurately written within the character entry frame. In particular, a major problem arises if numerical and character data such as account numbers and amounts on payment notification slips are misread.

(発明が解決しようとする課題) このように、帳票に設けられた文字記入枠内に記入され
た文字が、枠に接触したり、はみ出しているような場合
には、文字認識率が低下してしまうという問題があった
(Problem to be Solved by the Invention) As described above, if the characters written in the character entry frame provided on the form touch or protrude from the frame, the character recognition rate decreases. There was a problem with this.

本発明は前記のような点に鑑みてなされたもので、文字
記入枠に記入された文字か、枠に接触・はみ出している
ような場合であっても、好適な文字読取り結果を得るこ
とが可能な光学的文字読取装置を提供することを目的と
する。
The present invention has been made in view of the above points, and it is possible to obtain suitable character reading results even when the characters are written in the character entry frame or touch or protrude from the frame. The purpose of the present invention is to provide a possible optical character reading device.

[発明の構成コ (課題を解決するための手段) 本発明は、帳票の文字記入枠内に記入された文字の前記
文字記入枠に対する接触・はみ出し状態を検出する接触
・はみ出し状態検出手段と、この接触・はみ出し状態検
出手段によって接触・はみ出しが検出された文字につい
て、接触・はみ出した部分を除いた前記文字記入枠内に
存在する部分文字パターンを検出する文字パターン検出
手段と、読取りの対象とする複数の文字毎に、文字記入
枠への接触・はみ出しによって形成される部分文字パタ
ーンの文字認識処理に用いられる標準文字パターンを格
納するための辞書格納手段と、接触・はみ出し状態検出
手段によって検出された文字の前記文字記入枠に対する
接触・はみ出し状態に応じて、辞書格納手段に格納され
た標帛パターンを読出し、文字パターン検出手段によっ
て検出された前記部分文字パターンについて文字認識処
理を行なう文字認識処理手段とを具備して構成するもの
である。
[Configuration of the Invention (Means for Solving the Problems) The present invention provides contact/extrusion state detection means for detecting a state in which characters written in a character entry frame of a form are in contact with or protrude from the character entry frame; A character pattern detection means for detecting a partial character pattern existing within the character writing frame excluding the touching/protruding portion of the character whose contact/protrusion has been detected by the contact/protrusion state detection means; A dictionary storage means for storing standard character patterns used in character recognition processing for partial character patterns formed by contacting and protruding from the character entry frame, and a contact/protrusion state detection means for each of the plurality of characters. character recognition that reads out a signature pattern stored in a dictionary storage means and performs character recognition processing on the partial character pattern detected by the character pattern detection means according to the state of contact or protrusion of the character with respect to the character entry frame; The apparatus is configured to include a processing means.

さらに、接触・はみ出し状態は、文字記入枠の上下左右
の各方向に対する文字の接触・はみ出し数によって示し
、標準パターンは文字記入枠の上下左右の各方向におけ
る接触・はみ出し数毎にそれぞれ対応して辞書格納手段
に格納されるようにするものである。
Furthermore, the contact/protrusion state is indicated by the number of characters touching/protruding in each direction of the character entry frame in the up, down, left, and right directions, and the standard pattern corresponds to the number of contact/protrusion in each direction of the character entry frame in the up, down, left, and right directions. The information is stored in the dictionary storage means.

(作用) このような構成によれば、文字記入枠に接触・はみ出し
で記入された文字については、辞書格納部に格納された
一般の標準文字パターンと異なった接触・はみ出して記
入された文字用の特定の標準文字パターンを用いて文字
認識処理が実行される。また、接触・はみ出して記入さ
れた文字用の標準文字パターンは、読取り対象とする文
字のそれぞれについて辞書格納部に格納されるため、文
字記入枠への接触・はみ出しによって形成される部分文
字パターンが、他の文字に類似するような場合であって
も、少なくとも誤読することを防ぐ(リジェクトさせる
)ことができる。
(Operation) According to this configuration, for characters written in contact with or protruding from the character entry frame, a character written in contact with or protruding from the character entry frame that is different from the general standard character pattern stored in the dictionary storage unit is used. Character recognition processing is performed using a specific standard character pattern. In addition, standard character patterns for characters that touch or protrude are stored in the dictionary storage section for each character to be read, so partial character patterns formed by touching or protruding from the character entry frame are stored in the dictionary storage section for each character to be read. , even if the characters are similar to other characters, it is possible to at least prevent them from being misread (rejected).

(実施例) 以下、図面を参照して本発明の一実施例を説明する。第
1図は同実施例に係わる光学的文字読取装置における文
字認識処理を行なう機能部分の構成を示すブロック図で
ある。同図において、+1は帳票から光学的に読み取っ
た文字行−荷分の2値化パターンを格納するためのライ
ンバッファである。ラインバッファHには、文字切出し
回路12、及び文字認識回路13が接続されている。文
字認識回路12は、ラインバッファIIに格納された文
字行−持分の2値化パターンから、1文字分の文字パタ
ーンを検出するものである。文字認識回路13は、文字
切出し回路I2によって検出された文字パターンについ
て、辞書メモリ14に格納された標章パターンをもとに
、1文字毎に文字認識処理を行なうものである。辞書メ
モリ14には、文字記入枠への接触・はみ出しがないよ
うに記入された文字の文字パターンを認識するための標
準パターンをはじめ、接触・はみ出しによる部分文字パ
ターン(文字記入枠内に存在するパターン)を認識する
ための(票準パターンが文字記入枠への接触・はみ出し
状態毎に格納されている。
(Example) Hereinafter, an example of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing the configuration of a functional part that performs character recognition processing in an optical character reading device according to the same embodiment. In the figure, +1 is a line buffer for storing a binary pattern of character lines and items read optically from a form. A character cutting circuit 12 and a character recognition circuit 13 are connected to the line buffer H. The character recognition circuit 12 detects a character pattern for one character from the character line-equity binarized pattern stored in the line buffer II. The character recognition circuit 13 performs character recognition processing for each character on the character pattern detected by the character cutting circuit I2, based on the symbol pattern stored in the dictionary memory 14. The dictionary memory 14 contains standard patterns for recognizing character patterns of characters written without touching or protruding from the character entry frame, as well as partial character patterns due to contact or protrusion (existing within the character entry frame). (patterns) are stored for each state of contact with or protrusion from the character entry frame.

次に、同実施例の動作を説明する。Next, the operation of this embodiment will be explained.

ここでは、第2図に示すような帳票を文字読取り処理の
対象とするものとする。まず、第2図に示す帳票につい
て、スキャナ装置等において光学的に走査を行ない、帳
票イメージの検出を行なう。
Here, it is assumed that a form as shown in FIG. 2 is to be subjected to character reading processing. First, the form shown in FIG. 2 is optically scanned using a scanner device or the like to detect the form image.

帳票イメージが検出されると、予め設定された読取制御
情報に基づいて、文字読取り処理の対象とする領域(行
)のイメージが検出される。なお、読取り制御情報に基
づいて実行される処理については説明を省略する。第2
図に示す帳票の場合、データ行(口座番号、金額が記入
される行)の行イメージが検出され、図中Aのデータラ
インを介して、ラインバッファ11に転送される。ライ
ンはバッファ11に1行分のイメージデータか転送され
ると、図示せぬ回路(例えば装置全体の制御を司る制御
回路)から図中Bの制御ラインを介して、文字切出し回
路12に対して文字切出し開始信号が与えられる。文字
切出し回路12は、文字切出し開始信号を入力すると、
図中Cのデータラインを介してラインバッファ11を走
査して、1文字分の文字パターンの検出を行なう。文字
切出し回路12は、次のようにして文字パターンの検出
を行なう。まず、ラインバッファ11に格納された1行
分のイメージパターンから、第3図に示すように、水平
(X方向)・垂直(Y方向)のそれぞれの方向別ヒスト
グラムを求め、この方向別ヒストグラムをもとに文字記
入枠の抽出を行なう。文字記入枠の判別は、X方向、Y
方向のそれぞれのヒストグラムにおいて、ヒストグラム
値があるスライスレベル以上であり、尚且つそのヒスト
グラムの座標が、予め想定された枠サイズを示すピッチ
(例えば読取制御情報によって与えられる)の誤差範囲
内であるか否かによって行なう。文字記入枠の抽出が終
了すると、文字切出し回路12は、上下左右のそれぞれ
の文字記入枠線と文字パターン(文字線)とか交差(接
触)している数(接触・はみ出しクリップ数)を第4図
に示すようにして求める。ここでは、左側文字枠線に対
しての接触・はみ出しクリップ数を(L)、同様にして
右側(R)、上側(T)、下側(B)とする。第4図は
、数字「0」が左側文字枠線に対してはみ出している例
を示すものである。接触・はみ出しクリップ数の検出方
法は、例えば各文字記入枠線の内側(文字側)の1ビツ
トを走査して、白ビット(例えば“0″)から黒ビット
(例えば・1”)に変化する変化点数を求める。第4図
においては、CI。
When a form image is detected, an image of an area (line) targeted for character reading processing is detected based on preset reading control information. Note that a description of the processing executed based on the reading control information will be omitted. Second
In the case of the form shown in the figure, the line image of the data line (the line where the account number and amount are entered) is detected and transferred to the line buffer 11 via the data line A in the figure. When one line of image data is transferred to the buffer 11, the line is sent from a circuit (not shown) (for example, a control circuit that controls the entire device) to the character cutting circuit 12 via the control line B in the figure. A character cutting start signal is given. When the character cutting circuit 12 receives a character cutting start signal,
The line buffer 11 is scanned through the data line C in the figure to detect a character pattern for one character. The character cutting circuit 12 detects character patterns in the following manner. First, from the image pattern for one line stored in the line buffer 11, as shown in FIG. Based on this, extract the character entry frame. The character entry frame can be determined in the X direction and Y direction.
In each histogram in the direction, is the histogram value greater than or equal to a certain slice level, and is the coordinate of the histogram within the error range of the pitch (for example, given by reading control information) that indicates the pre-assumed frame size? It depends on whether or not. When the extraction of the character entry frame is completed, the character cutting circuit 12 calculates the number of character patterns (character lines) that intersect (contact) with each of the upper, lower, left, and right character entry frame lines (the number of touching/protruding clips). Obtain as shown in the figure. Here, the number of clips touching and protruding from the left side character frame line is (L), and similarly, the number of clips on the right side (R), the upper side (T), and the lower side (B). FIG. 4 shows an example in which the number "0" protrudes from the left character frame line. The method of detecting the number of touching/protruding clips is, for example, by scanning one bit inside each character entry frame line (on the character side) and changing it from a white bit (for example, "0") to a black bit (for example, 1). Find the number of change points.In Figure 4, CI.

C2において白から黒に変化していることか検出され、
変化点数−2が左側文字記入枠線の接触・はみ出しクリ
ップ数(L)となる。こうして、第4図に示す数字「0
」の接触・はみ出しクリップ数は、(L)−2、(R)
−0、(T)−0、(B)−0となる。次に、文字切出
し回路12は、文字記入枠のパターンを除去し、文字記
入枠内に位置する文字パターン(部分文字パターン)を
抽出する。こうして得られた文字パターン(部分文字パ
ターン)は、データラインCを介して文字認識回路13
に転送される。ただし、文字記入枠にり1する接触・は
み出しのない文字パターンについては、通常の文字パタ
ーンが転送されることになる。
A change from white to black is detected at C2,
The number of change points -2 is the number of clips (L) that touch and protrude from the left side character entry frame line. In this way, the number “0” shown in FIG.
The number of clips in contact and protrusion is (L)-2, (R)
-0, (T)-0, (B)-0. Next, the character cutting circuit 12 removes the pattern of the character entry frame and extracts a character pattern (partial character pattern) located within the character entry frame. The character pattern (partial character pattern) thus obtained is sent to the character recognition circuit 13 via the data line C.
will be forwarded to. However, for character patterns that do not touch or protrude from the character entry frame, normal character patterns will be transferred.

また、文字切出し回路12は、文字記入枠における接触
・はみ出しクリップ数を、部分文字パターン(文字パタ
ーン)の付加情報として文字認識回路13に転送すると
共に、信号ラインDを介して文字認識処理の開始を指示
する認識開始信号を出力する。文字認識回路13は、文
字切出し回路12かろの認識開始信号を入力すると、デ
ータラインCを介して入力した文字パターン(部分文字
パターン)について、辞書メモリ14に予め格納された
読取りの対象とする各文字についての標準パターンとの
照合を行なうことによって文字認識処理を行なう。
In addition, the character cutting circuit 12 transfers the number of clips that touch and protrude in the character entry frame to the character recognition circuit 13 as additional information of the partial character pattern (character pattern), and also starts character recognition processing via the signal line D. Outputs a recognition start signal that instructs. When the character recognition circuit 13 receives the recognition start signal from the character cutting circuit 12, the character recognition circuit 13 selects each of the character patterns (partial character patterns) input via the data line C to be read, which are stored in advance in the dictionary memory 14. Character recognition processing is performed by comparing characters with standard patterns.

文字認識処理に用いられる辞書メモリ14には、第5図
に示すように、辞書エントリポイントが設定され、標章
パターンが格納されている。第5図は、数字の文字パタ
ーンを認識するために用いられる辞書のエントリポイン
トを示すものである。すなわち、辞書メモリ14には、
読取りの対象とする文字のそれぞれについて、各文字記
入枠線への接触・はみ出しクリップ数の組(接触・はみ
出し状態)毎に辞書エントリポイントが設定され、接触
・はみ出し状態に応じた標準パターンが格納される。
In the dictionary memory 14 used for character recognition processing, dictionary entry points are set and mark patterns are stored, as shown in FIG. FIG. 5 shows the entry points of a dictionary used to recognize character patterns of numbers. That is, in the dictionary memory 14,
For each character to be read, a dictionary entry point is set for each set of the number of clips that touch and protrude from each character entry frame line (contact/protrude state), and a standard pattern corresponding to the contact/protrusion state is stored. be done.

例えば、数字「0」の文字パターンを認識するための認
識辞書は、上下左右の文字記入枠への接触・はみ出しか
ないパターン用の辞書(L−0,R−O,T−0,B−
0) 、左側文字記入枠線のみにクリップ数−2ではみ
出したパターン(第4図に示すようなパターン)用辞書
(L−2,R−0゜T−0,B−0) 、下側文字記入
枠線のみにクリップ数−2ではみ出したパターン用辞書
(L−0゜R−0,T−0,B−2) 、及び前記条件
を満足しないその他のパターン用辞書(L−*、R−*
For example, a recognition dictionary for recognizing the character pattern of the number "0" is a dictionary for patterns that do not touch or protrude from the upper, lower, left, or right character entry frames (L-0, R-O, T-0, B-
0), Dictionary for a pattern (pattern as shown in Figure 4) that protrudes only on the left side character entry frame line with the number of clips -2 (L-2, R-0°T-0, B-0), Bottom side Pattern dictionaries (L-0°R-0, T-0, B-2) that protrude only from the character entry frame line with the number of clips -2, and other pattern dictionaries that do not satisfy the above conditions (L-*, R-*
.

T−*、B−*)で構成されている。同様に、他の文字
についても、各文字によって可能性のある接触・はみ出
し状態毎に辞書が構成される。
T-*, B-*). Similarly, for other characters, a dictionary is constructed for each possible contact/protrusion state of each character.

文字認識回路13は、認識対象とする文字パターン(部
分文字パターン)の付加情報として入力した接触・はみ
出しクリップ数に応じた辞書エントリポイントによって
示される辞書(標準パターン)を辞書メモリ14から呼
出し、文字パターンと照合を行なうことによって文字を
認識する。こうして文字認識結果(文字コード)が得ら
れると、文字認識回路13は、この認識結果をデータラ
インEへ出力する。さらに、文字認識回路13は、1文
字分の文字認識が終了すると、信号ラインFを介して、
1文字認識回路信号を文字切出し回路12に出力する。
The character recognition circuit 13 reads from the dictionary memory 14 the dictionary (standard pattern) indicated by the dictionary entry point corresponding to the number of contact/protrusion clips input as additional information of the character pattern (partial character pattern) to be recognized, and Recognize characters by matching them with patterns. When the character recognition result (character code) is thus obtained, the character recognition circuit 13 outputs this recognition result to the data line E. Furthermore, when character recognition for one character is completed, the character recognition circuit 13 transmits the following information via the signal line F.
A single character recognition circuit signal is output to the character cutting circuit 12.

これによって、文字切出し回路12は、ラインバッファ
11に格納されたイメージから、次の文字認識処理の対
象とする文字パターンの切出しを開始する。
As a result, the character cutting circuit 12 starts cutting out a character pattern to be subjected to the next character recognition process from the image stored in the line buffer 11.

以下同様な処理を繰り返して、各文字記入枠内に存在す
る文字パターン(部分文字パターン)を切出して、文字
認識処理を行なう。
Thereafter, similar processing is repeated to cut out character patterns (partial character patterns) existing within each character entry frame and perform character recognition processing.

ここで、文字認識処理の一例について説明する。Here, an example of character recognition processing will be described.

第2図中の(a)の文字記入枠における文字パターンは
、下側枠線をクリップ数=2ではみ出しているため(第
3図参照)、文字切出しの際の枠パターン除去によって
第6図(a)のような部分文字パターンとなる。このよ
うな部分文字パターンについても、辞書メモリ14に文
字パターンの下部が欠けた文字パターン用の辞書が格納
されていれば数字「6」であると認識することかできる
。また、第2図中(b)の文字記入枠内における文字パ
ターンは、左側枠線をクリップ数−3ではみ出している
ため、文字切出しの際の枠パターン除去によって第6図
(b)のような部分文字パターンとなる。この部分文字
パターンは、数字「3」と類似しているが、左側文字枠
へのクリップ数−3の辞書(数字「8」用の辞書として
用意される)を用いて文字認識処理されるので、少なく
ともリジェクトして数字「3」に誤読されることを防ぐ
ことができる(ただし、数字「3」用の辞書に左側文字
枠へのクリップ数−3の辞書が用意されていない場合)
。同様に、第2図中(c)の文字記入枠における文字パ
ターンは、枠パターン除去によって第6図(c)のよう
な部分文字パターンとなるが、この部分文字パターン用
の辞書を用意することによって、数字「7」に誤読され
ることを防ぐことができる。なお、第2図中(d)の文
字記入枠における部分文字パターンは、図中に示すよう
なりリップによって他と間違い易い相手文字か無い。こ
のため、特にクリップして得られる部分文字パターン用
の辞書を用意する必要がなく、−船釣な数字「5」用の
辞書を用いて文字認識回路を行なうようにすれば良い。
The character pattern in the character entry frame (a) in Figure 2 extends beyond the lower frame line by the number of clips = 2 (see Figure 3), so by removing the frame pattern when cutting out characters, Figure 6 This results in a partial character pattern as shown in (a). Such a partial character pattern can also be recognized as the number "6" if the dictionary memory 14 stores a dictionary for character patterns in which the lower part of the character pattern is missing. In addition, since the character pattern in the character entry frame in Figure 2 (b) extends beyond the left side frame line by the number of clips - 3, the frame pattern is removed when cutting out characters, resulting in the character pattern shown in Figure 6 (b). It becomes a partial character pattern. This partial character pattern is similar to the number "3", but it is processed for character recognition using the dictionary (prepared as a dictionary for the number "8") with the number of clips to the left character frame minus 3. , it is possible to at least reject it and prevent it from being misread as the number "3" (provided that the dictionary for the number "3" does not have a dictionary for the number of clips to the left character frame - 3).
. Similarly, the character pattern in the character entry frame in Figure 2 (c) becomes a partial character pattern as shown in Figure 6 (c) by removing the frame pattern, but it is necessary to prepare a dictionary for this partial character pattern. This can prevent the number from being misread as the number "7". It should be noted that the partial character pattern in the character entry frame in FIG. 2(d) does not have any other characters that are easily confused with other characters due to the lip as shown in the figure. Therefore, there is no need to prepare a dictionary specifically for partial character patterns obtained by clipping, and the character recognition circuit can be implemented using a dictionary for the numeral "5".

また、数字「3」も同様に、左側文字枠ヘクリップした
場合であっても、他と間違い易い相手文字が無いため、
 QX的な数字「3」用の辞書を用いて文字認識処理を
行なうようにすれば良い。これより、左側枠線をクリッ
プ数−3ではみだした数字「8」の部分文字パターンに
ついて文字認識を行なう場合に、数字「3」用の辞書が
選択されない。
Similarly, even if the number "3" is clipped to the left character frame, there is no other character that can easily be mistaken for another character, so
Character recognition processing may be performed using a QX-like dictionary for the number "3". As a result, when performing character recognition on the partial character pattern of the number "8" that extends beyond the left side frame line by the number of clips minus three, the dictionary for the number "3" is not selected.

このようにして、文字記入枠への接触・はみ出し方向、
及びクリップ数羽に、部分文字パターンについての文字
認識処理に用いられる認識辞書(標準パターン)を用意
することにより、帳票に記入された文字が文字記入枠(
黒枠等の非ドロップアウトカラー)に接触・はみ出して
いる場合であっても、部分文字パターン用の認識辞書を
用いて対処するので、少なくとも誤読することを防ぐこ
とができる。
In this way, the direction of contact and protrusion to the character entry frame,
By preparing a recognition dictionary (standard pattern) used for character recognition processing for partial character patterns in several clips, the characters written on the form can be displayed in the character entry frame (
Even if the character touches or protrudes from a non-dropout color (such as a black frame), the recognition dictionary for partial character patterns is used to deal with this, so at least misreading can be prevented.

また、従来、非ドロップアウトカラーによる文字記入枠
に接触・はみ出した文字パターンを切り出すことが困難
であるために、文字記入枠はドロップアウトカラーによ
って印刷等されていた。しかしながら、本発明では、文
字記入枠に対する接触・はみ出しによる部分文字パター
ンについて認識処理を実行することができる。従って、
文字記入枠を必ずしもドロップアウトカラーにする必要
がないため、これに応じた特定の光源を用いる必要がな
く、一つの光源を用いて帳票のイメージを検出し、文字
認識を行なうことができる。
Furthermore, conventionally, character entry frames have been printed using dropout colors because it is difficult to cut out character patterns that touch or protrude from character entry frames using non-dropout colors. However, in the present invention, recognition processing can be executed for partial character patterns that touch or protrude from the character entry frame. Therefore,
Since the character entry frame does not necessarily have to be in a dropout color, there is no need to use a specific light source corresponding to this, and it is possible to detect the image of the form and perform character recognition using a single light source.

[発明の効果] 以上のように本発明によれば、帳票に設けられた文字記
入枠に接触・はみ出して記入された文字の文字パターン
(部分文字パターン)について文字認識処理を行なうた
めの辞書を接触・はみ出し状態毎に用意しているので、
文字が枠に接触・はみ出している場合であっても、この
辞書を用いて文字認識処理を行なうことにより、好適な
文字読取り結果を得ることができるものである。
[Effects of the Invention] As described above, according to the present invention, a dictionary is provided for performing character recognition processing on character patterns (partial character patterns) of characters written in contact with or protruding from a character entry frame provided on a form. Prepared for each contact/extrusion condition,
Even if the characters touch or protrude from the frame, suitable character reading results can be obtained by performing character recognition processing using this dictionary.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の一実施例に係わる光学的文字読取装置
における文字認識処理を行なう機能部分の構成を示すブ
ロック図、第2図は文字読取処理の対象とする帳票の一
例を示す図、第3図は文字記入枠抽出の処理を説明する
ための図、第4図は文字記入枠に対する文字パターンの
接触・はみ出しクリップ数を求める処理を説明するため
の図、第5図は各文字の接触・はみ出しクリップ数と辞
書エントリポイントとの対応を示す図、第6図は部分文
字パターンの一例を示す図である。 11・・・ラインバッファ、12・・・文字切出し回路
、I3・・−文字認識回路、14・・・辞書メモリ第1
FIG. 1 is a block diagram showing the configuration of a functional part that performs character recognition processing in an optical character reading device according to an embodiment of the present invention, and FIG. 2 is a diagram showing an example of a form to be subjected to character reading processing. Figure 3 is a diagram for explaining the process of character entry frame extraction, Figure 4 is a diagram for explaining the process of calculating the number of clips in which a character pattern touches and protrudes from the character entry frame, and Figure 5 is a diagram for explaining the process of character entry frame extraction. FIG. 6 is a diagram showing the correspondence between the number of touching/protruding clips and dictionary entry points, and FIG. 6 is a diagram showing an example of a partial character pattern. 11...Line buffer, 12...Character extraction circuit, I3...Character recognition circuit, 14...Dictionary memory first
figure

Claims (2)

【特許請求の範囲】[Claims] (1)帳票に設けられた文字記入枠内に記入された文字
の読取りを行なう光学的文字読取装置において、 前記帳票の文字記入枠内に記入された文字の前記文字記
入枠に対する接触・はみ出し状態を検出する接触・はみ
出し状態検出手段と、 前記接触・はみ出し状態検出手段によって接触・はみ出
しが検出された文字について、接触・はみ出した部分を
除いた前記文字記入枠内に存在する部分文字パターンを
検出する文字パターン検出手段と、 読取りの対象とする複数の文字のそれぞれについて、文
字記入枠への接触・はみ出しによって形成される部分文
字パターンの文字認識処理に用いられる標準文字パター
ンを、前記接触・はみ出し状態毎に格納するための辞書
格納手段と、 前記接触・はみ出し状態検出手段によって検出された文
字の前記文字記入枠に対する接触・はみ出し状態に応じ
て、前記辞書格納手段に格納された標準パターンを読出
し、前記文字パターン検出手段によって検出された前記
部分文字パターンについて文字認識処理を行なう文字認
識処理手段と、を具備したことを特徴とする光学的文字
読取装置。
(1) In an optical character reading device that reads characters written in a character entry frame provided on a form, the state in which characters written in the character entry frame of the form are in contact with or protrude from the character entry frame a contact/protrusion state detection means for detecting a contact/protrusion state detection means; and a partial character pattern existing within the character entry frame excluding the contact/protrusion portion of the character whose contact/protrusion has been detected by the contact/protrusion state detection means; For each of the plurality of characters to be read, a standard character pattern used for character recognition processing of a partial character pattern formed by contacting or protruding from a character entry frame is detected. a dictionary storage means for storing data for each state; and a standard pattern stored in the dictionary storage means is read out according to a contacting/protruding state of a character with respect to the character writing frame detected by the contacting/protruding state detecting means. , character recognition processing means for performing character recognition processing on the partial character pattern detected by the character pattern detection means.
(2)前記接触・はみ出し状態は、前記文字記入枠の上
下左右の各方向に対する文字の接触・はみ出し数によっ
て示し、前記標準パターンは、前記文字記入枠の上下左
右の各方向における接触・はみ出し数毎にそれぞれ対応
して前記辞書格納手段に格納されることを特徴とする第
1請求項記載の光学的文字読取装置。
(2) The contacting/protruding state is indicated by the number of characters touching/protruding in each of the up, down, left, and right directions of the character entry frame, and the standard pattern is the number of contacting/protruding characters in each of the up, down, left, and right directions of the character entry frame. 2. The optical character reading device according to claim 1, wherein each character is stored in said dictionary storage means in correspondence with each other.
JP1258772A 1989-10-05 1989-10-05 Optical character reader Expired - Lifetime JP2877380B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1258772A JP2877380B2 (en) 1989-10-05 1989-10-05 Optical character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1258772A JP2877380B2 (en) 1989-10-05 1989-10-05 Optical character reader

Publications (2)

Publication Number Publication Date
JPH03122786A true JPH03122786A (en) 1991-05-24
JP2877380B2 JP2877380B2 (en) 1999-03-31

Family

ID=17324870

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1258772A Expired - Lifetime JP2877380B2 (en) 1989-10-05 1989-10-05 Optical character reader

Country Status (1)

Country Link
JP (1) JP2877380B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003099708A (en) * 2001-09-21 2003-04-04 Toshiba Corp Character recognition device, letter sorting machine, character recognition method and sorting method
JP2012185713A (en) * 2011-03-07 2012-09-27 Mitsubishi Electric Corp Business form character recognition device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003099708A (en) * 2001-09-21 2003-04-04 Toshiba Corp Character recognition device, letter sorting machine, character recognition method and sorting method
JP2012185713A (en) * 2011-03-07 2012-09-27 Mitsubishi Electric Corp Business form character recognition device

Also Published As

Publication number Publication date
JP2877380B2 (en) 1999-03-31

Similar Documents

Publication Publication Date Title
US4481665A (en) Character segmentation method
JPS63158678A (en) Inter-word space detecting method
KR100383858B1 (en) Character extracting method and device
IL98293A (en) Method of discriminating between text and graphics
JP5041775B2 (en) Character cutting method and character recognition device
JPH03122786A (en) Optical character reader
JP2001109887A (en) Area extracting method, method and device for extracting address area, and image processor
JP3794285B2 (en) Optical character reader
JP2630261B2 (en) Character recognition device
JPH0991385A (en) Character recognition dictionary adding method and terminal ocr device using same
JP2868392B2 (en) Handwritten symbol recognition device
JP2001291058A (en) Character recognizing device and recording medium
JP2925270B2 (en) Character reader
JPS6160184A (en) Optical character reader
JP2778436B2 (en) Character segmentation device
JP2002074269A (en) Method for recognizing character
JPH03282895A (en) Optical character reader
JPH0632074B2 (en) Normalization method
JPH10233930A (en) Image processor
JPS62295192A (en) Optical character image reader
JPH08101886A (en) Character recognition device
JPH0535921A (en) Device and method for collating character
JPS63136181A (en) Character reader
JPH1040338A (en) Optical character reader
JPH06301814A (en) Character reader

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080122

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090122

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100122

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100122

Year of fee payment: 11