JPH04322390A - Character recognition device - Google Patents

Character recognition device

Info

Publication number
JPH04322390A
JPH04322390A JP3119216A JP11921691A JPH04322390A JP H04322390 A JPH04322390 A JP H04322390A JP 3119216 A JP3119216 A JP 3119216A JP 11921691 A JP11921691 A JP 11921691A JP H04322390 A JPH04322390 A JP H04322390A
Authority
JP
Japan
Prior art keywords
character
black dot
validity
blocks
control unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3119216A
Other languages
Japanese (ja)
Inventor
Mitsuru Takiguchi
充 瀧口
Naoto Aoki
直人 青木
Seiji Doi
土井 清司
Toshiyuki Ono
利幸 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP3119216A priority Critical patent/JPH04322390A/en
Publication of JPH04322390A publication Critical patent/JPH04322390A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To avoid the degradation of the recognition rate by accurately determining a character frame even in the case of coupling of blocks of separated characters. CONSTITUTION:Character validity information 34 is preliminarily prepared, and it is discriminated in a character validity discriminating part 31 whether a black point block in a character frame 29 meets character validity information 34 or not. If it does not meet this information 34, a threshold to generate a binarized pattern is changed by the control of a threshold change control part 33, and discrimination in the character validity discriminating part 31 is repeated. Thus, erroneous recognition due to coupling of black point blocks or a lack of the space between them is reduced.

Description

【発明の詳細な説明】[Detailed description of the invention]

【0001】0001

【産業上の利用分野】本発明は、媒体上に記載された文
字の認識を行なう文字認識装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition device for recognizing characters written on a medium.

【0002】0002

【従来の技術】金融機関等で取扱われる小切手や伝票等
のいわゆる帳票には、E13B文字と呼ばれる所定の規
格の文字を用いて、各種情報の表示がなされている。こ
のE13B文字は、数値を示す数値文字(0〜9の10
文字)と、数値以外の記号(4文字)を示す分離文字か
ら構成されるものである。また、帳票上のE13B文字
読取りの自動化を実現するため、光学式文字読取り装置
(OCR)が広く利用されている。
2. Description of the Related Art In so-called forms such as checks and slips handled by financial institutions, various information is displayed using characters of a predetermined standard called E13B characters. This E13B character is a numeric character (0 to 9, 10
It consists of a character) and a separator character indicating a symbol (4 characters) other than a numerical value. Furthermore, optical character readers (OCR) are widely used to automate the reading of E13B characters on forms.

【0003】図2に、一般的な光学式文字読取り装置の
概念図を示す。図に示した光学式文字読取り装置のイメ
ージセンサ2は、帳票1上の文字に対応するイメージデ
ータを獲得し、電気信号に変換する光学センサ等から構
成されるもので、読取ったイメージデータのドット毎に
多値データ(濃度を示す階調データ)を出力するもので
ある。
FIG. 2 shows a conceptual diagram of a general optical character reading device. The image sensor 2 of the optical character reading device shown in the figure is composed of an optical sensor etc. that acquires image data corresponding to the characters on the form 1 and converts it into an electrical signal. It outputs multi-value data (gradation data indicating density) for each time.

【0004】多値パターンメモリ3は、イメージセンサ
2から出力される多値データを、イメージセンサ2の読
取ったドット毎に格納するRAM等から構成されるもの
である。なお、多値パターンメモリ3における多値デー
タの格納形態は、帳票1上の位置、即ちイメージデータ
を構成するドットの帳票1上の位置に対応するよう、2
次元的に格納されている。2値化回路4は、多値パター
ンメモリ3に格納された多値データを予め設定された所
定の閾値で2分割(白黒の決定)し、2値データを出力
する比較器等から構成されるものである。
The multi-value pattern memory 3 is composed of a RAM and the like that stores multi-value data output from the image sensor 2 for each dot read by the image sensor 2. Note that the storage format of the multi-value data in the multi-value pattern memory 3 is such that the multi-value data is stored in two formats so as to correspond to the positions on the form 1, that is, the positions on the form 1 of the dots constituting the image data.
stored dimensionally. The binarization circuit 4 is composed of a comparator and the like that divides the multi-value data stored in the multi-value pattern memory 3 into two parts (determining black and white) using a predetermined threshold set in advance and outputs binary data. It is something.

【0005】2値パターンメモリ5は、2値化回路4の
出力する2値データを格納するRAM等から構成される
もので、多値パターンメモリ3の格納形式に対応して、
2次元的な格納形式がとられている。Xアドレスレジス
タ6は、2値パターンメモリ5のX方向のアドレスを示
すレジスタである。Yアドレスレジスタ7は、2値パタ
ーンメモリ5のY方向のアドレスを示すレジスタである
。切出し制御部8は、2値化回路4の閾値制御、及び2
値パターンメモリ5に格納された所定の2値データを抽
出する制御を行なうものである。なお、所定の2値デー
タとは、帳票1上の予め設定されたE13B文字の記載
位置に対応するパターンメモリ5に格納された2値デー
タをいう。
The binary pattern memory 5 is composed of a RAM etc. that stores the binary data output from the binarization circuit 4, and corresponds to the storage format of the multi-value pattern memory 3.
A two-dimensional storage format is used. The X address register 6 is a register indicating the address of the binary pattern memory 5 in the X direction. The Y address register 7 is a register indicating the address of the binary pattern memory 5 in the Y direction. The extraction control unit 8 controls the threshold value of the binarization circuit 4 and
It controls the extraction of predetermined binary data stored in the value pattern memory 5. Note that the predetermined binary data refers to binary data stored in the pattern memory 5 corresponding to a preset position of the E13B character on the form 1.

【0006】フォーマットテーブル9は、2値化回路4
の閾値及び2値パターンメモリ5上の2値データ抽出領
域、即ち帳票1上のE13B文字の記載位置を特定する
ための各種情報が設定されたROM等から構成されるテ
ーブルである。認識部10は、切出し制御部8の制御に
より抽出されたE13B文字の内容を認識し、所定の文
字コードを出力するものである。主制御部11は、認識
部10の認識結果を、図示しない表示装置に表示する等
の編集処理を実施するものである。
[0006] The format table 9 is provided by the binarization circuit 4.
This table is made up of a ROM, etc., in which various information for specifying the threshold value and the binary data extraction area on the binary pattern memory 5, that is, the writing position of the E13B character on the form 1, is set. The recognition unit 10 recognizes the content of the E13B character extracted under the control of the extraction control unit 8 and outputs a predetermined character code. The main control unit 11 performs editing processing such as displaying the recognition result of the recognition unit 10 on a display device (not shown).

【0007】図3に、帳票1の概念図を示す。図に示す
ように、帳票1上のE13B文字を記載する位置が、帳
票1の左端部Pから垂直方向文字位置20及び水平方向
文字位置21で示される位置の右方に設定されるものと
する。そして、E13B文字を配列する間隔を文字間隔
22、そして文字の高さを文字高さ23であるものとす
る。即ち、垂直方向文字位置20及び水平方向文字位置
21を基準に、文字高さ23のE23B文字が文字間隔
22で記載されることになる。
FIG. 3 shows a conceptual diagram of the form 1. As shown in the figure, the position where the E13B character is written on the form 1 is set to the right of the position indicated by the vertical character position 20 and the horizontal character position 21 from the left edge P of the form 1. . It is assumed that the interval at which the E13B characters are arranged is character interval 22, and the height of the characters is character height 23. In other words, E23B characters with a character height of 23 are written at a character interval of 22 based on the vertical character position 20 and the horizontal character position 21.

【0008】図4に、2値パターンメモリ5の概念図を
示す。図は、図3において説明した帳票1の読取りを行
なった結果、2値パターンメモリ5に格納される2値デ
ータの内容及び配列を示したもので、帳票1上に記載さ
れたE13B文字の帳票1上の位置を把握できる格納形
態が採られている。切出し制御部8は、認識部10が抽
出するE13B文字に対応する2値データの格納された
領域を2値パターンメモリ5上から切出すため、切出し
領域の決定を行なうことになる。
FIG. 4 shows a conceptual diagram of the binary pattern memory 5. The figure shows the content and arrangement of binary data stored in the binary pattern memory 5 as a result of reading the form 1 explained in FIG. A storage format is adopted that allows the user to know the location on the top of the screen. The cutout control unit 8 determines the cutout area in order to cut out the area storing the binary data corresponding to the E13B character extracted by the recognition unit 10 from the binary pattern memory 5.

【0009】即ち、切出し制御部8は、フォーマットテ
ーブル9に格納された垂直方向文字位置20及び文字高
さ23に基づいて、2値パターンメモリ5上の上限25
及び下限26を決定する。その後、切出し制御部8は、
フォーマットテーブル9に格納された水平方向文字位置
21及び文字間隔22に基づいて、左限27及び右限2
8を決定し、E13B文字の1文字に相当する2値デー
タの格納された領域を抽出する。更に切出し制御部8は
、上限25、下限26、左限27、右限28に囲まれる
切出し領域を縮小し、E13B文字の1文字分を収容す
る文字枠29を決定する。文字枠29の決定が完了する
と、切出し制御部8によるE13B文字の1文字分の処
理が完了し、その後、認識部10による文字枠29内の
文字認識が実施される。
That is, the cutting control unit 8 determines the upper limit 25 in the binary pattern memory 5 based on the vertical character position 20 and character height 23 stored in the format table 9.
and determine the lower limit 26. After that, the cutting control section 8
Based on the horizontal character position 21 and character spacing 22 stored in the format table 9, the left limit 27 and the right limit 2 are
8 is determined, and an area in which binary data corresponding to one E13B character is stored is extracted. Furthermore, the cutout control unit 8 reduces the cutout area surrounded by the upper limit 25, lower limit 26, left limit 27, and right limit 28, and determines a character frame 29 that accommodates one E13B character. When the determination of the character frame 29 is completed, the processing for one E13B character by the extraction control unit 8 is completed, and then the recognition unit 10 performs character recognition within the character frame 29.

【0010】ところで、切出し制御部8は、帳票1上で
E13B文字の印刷位置がずれていた場合にも、的確に
文字枠29を決定するために左限27及び右限28の補
正を行なう。図5に、切出し制御部8による補正の説明
図を示す。切出し制御部8は、文字枠29中の最も左に
位置するブロック(E13B文字の構成要素)の横幅W
を測定し、この横幅Wが、予め設定された横幅閾値TH
を越える場合、文字枠29の位置を決定していた。また
、横幅Wが横幅閾値TH以下であるならば、文字枠29
の位置を再設定、例えば、右方向への移動等を行なう。
By the way, the cutout control section 8 corrects the left limit 27 and the right limit 28 in order to accurately determine the character frame 29 even when the printing position of the E13B character on the form 1 is shifted. FIG. 5 shows an explanatory diagram of correction by the cutout control section 8. The cutting control unit 8 controls the width W of the leftmost block (component of the E13B character) in the character frame 29.
is measured, and this width W is a preset width threshold TH.
, the position of the character frame 29 was determined. Further, if the width W is less than or equal to the width threshold TH, the character frame 29
Reset the position of , for example, move it to the right.

【0011】図6に、横幅閾値THの説明図を示す。図
に示すように、分離文字D1は、3つのブロックBL1
,BL2,BL3から構成されている。分離文字B1の
ブロックBL1の横幅をa、数値“1”を示す数値文字
S1の横幅をbとし、横幅閾値THは、(a+b)/c
で求めた値である。なお、cは適宜選択する値で、この
場合2である。
FIG. 6 shows an explanatory diagram of the width threshold TH. As shown in the figure, the separation character D1 is divided into three blocks BL1
, BL2, and BL3. The width of the block BL1 of the separated character B1 is a, the width of the numerical character S1 indicating the numerical value "1" is b, and the width threshold TH is (a+b)/c
This is the value obtained by . Note that c is a value selected as appropriate, and is 2 in this case.

【0012】0012

【発明が解決しようとする課題】ところで、帳票1への
E13B文字の印字濃度により、ブロックの結合が起き
る場合がある。ブロックが結合した場合、分離文字のブ
ロックでなく数値文字であると判断し、文字枠29の補
正が実行されなくなる。このため、その後に実施される
認識部10による認識ができず認識率の低下を招くとい
った問題が生じていた。本発明は以上の点に着目してな
されたもので、分離文字のブロックの結合が起きた場合
にも正確の文字枠の決定を行なうことができ、認識率の
低下を回避することのできる文字認識装置を提供するこ
とを目的としてなされたものである。
However, depending on the printing density of E13B characters on form 1, blocks may be combined. When the blocks are combined, it is determined that the blocks are not separate character blocks but numeric characters, and the correction of the character frame 29 is no longer executed. For this reason, a problem has arisen in that recognition by the recognition unit 10, which is performed subsequently, cannot be performed, leading to a decrease in the recognition rate. The present invention has been made with attention to the above points, and it is possible to accurately determine a character frame even when blocks of separated characters are combined, and to avoid a decrease in recognition rate. This was done for the purpose of providing a recognition device.

【0013】[0013]

【課題を解決するための手段】本発明の文字認識装置は
、媒体上に記載された複数の黒点ブロックから構成され
た文字を認識するものにおいて、前記黒点ブロックの2
次元的な特徴を検査し、当該黒点ブロックが前記文字を
構成するものであるか否かを判定する文字妥当性判定部
と、前記黒点ブロックが前記文字を構成するものである
判定がなされた場合、前記媒体から前記文字を記載した
領域を切出すための文字枠の切出し位置を特定する切出
し位置制御部と、前記黒点ブロックが前記文字を構成す
るものでない判定がなされた場合、前記黒点ブロックを
読取ってイメージデータに変換する場合の閾値を変更す
る閾値変更制御部とを備えたものである。
[Means for Solving the Problems] A character recognition device of the present invention recognizes a character composed of a plurality of black dot blocks written on a medium.
a character validity determination unit that inspects dimensional features and determines whether the black dot block constitutes the character; and a case where it is determined that the black dot block constitutes the character; , a cutout position control unit that specifies a cutout position of a character frame for cutting out an area in which the characters are written from the medium; The image data processing apparatus includes a threshold value change control unit that changes the threshold value when reading and converting into image data.

【0014】[0014]

【作用】予め文字妥当性情報を用意し、文字妥当性判定
部において、文字枠内の黒点ブロックが、文字妥当性情
報に該当するか判定する。該当しない場合は、閾値変更
制御部の制御により、2値化パターンを生成する閾値を
変更し、文字妥当性判定部による判定を繰返す。これに
より、黒点ブロックの結合や間隔不足による誤認識を減
少することができる。
[Operation] Character validity information is prepared in advance, and the character validity determination section determines whether a black dot block within a character frame corresponds to the character validity information. If it is not applicable, the threshold value for generating the binarized pattern is changed under the control of the threshold value change control unit, and the determination by the character validity determination unit is repeated. This makes it possible to reduce erroneous recognition due to the combination of black dot blocks or insufficient spacing.

【0015】[0015]

【実施例】本発明の文字認識装置は、先に図2において
説明した文字認識装置と同一の構成要素を備えているが
、切出し制御部8及びフォーマットテーブル9に特徴が
ある。図1に、本発明に係る文字認識装置の概略図を示
す。図には、先に図2において説明した切出し制御部8
及びフォーマットテーブル9が示されている。切出し制
御部8には、文字妥当性判定部31、切出し位置制御部
32、閾値変更制御部33が設けられている。文字妥当
性判定部31は、後に説明するフォーマットテーブル9
の文字妥当性情報34を参照して、切出した文字枠29
内の黒点ブロックがE13B文字として妥当であるか否
かを判定するものである。
DESCRIPTION OF THE PREFERRED EMBODIMENTS The character recognition device of the present invention has the same components as the character recognition device described above with reference to FIG. FIG. 1 shows a schematic diagram of a character recognition device according to the present invention. The figure shows the cutout control section 8 previously explained in FIG.
and a format table 9 are shown. The cutout control section 8 is provided with a character validity determination section 31, a cutout position control section 32, and a threshold value change control section 33. The character validity determination unit 31 uses a format table 9, which will be explained later.
The character frame 29 extracted by referring to the character validity information 34 of
This is to determine whether the black dot block within is valid as an E13B character.

【0016】切出し位置制御部32は、文字枠29の位
置を変更する制御を行なうものである。閾値変更制御部
33は、2値化回路4において実施される2値化の閾値
を制御するものである。フォーマットテーブル9には、
文字妥当性情報34が設けられている。文字妥当性情報
34は、文字妥当性判定部31が文字枠29内の黒点ブ
ロックがE13B文字として妥当か否かを判定する際の
情報である。
The cutout position control section 32 controls changing the position of the character frame 29. The threshold value change control unit 33 controls the threshold value of the binarization performed in the binarization circuit 4. Format table 9 contains
Character validity information 34 is provided. The character validity information 34 is information used when the character validity determination unit 31 determines whether a black dot block within the character frame 29 is valid as an E13B character.

【0017】図7に、文字妥当性情報34の説明図を示
す。図に示すように、E13B文字を構成する各文字に
ついて、水平(垂直方向の走査の結果)及び垂直方向(
水平方向の走査の結果)の特徴を数値化したもので、こ
の数値をここでは交差特徴と呼ぶことにする。交差特徴
は、E13B文字の個々について、ラスタ走査(ラスタ
スキャン)を行ない、白点から黒点(黒点ブロック)へ
の変化点、つまりエッジ点の数を計数する。
FIG. 7 shows an explanatory diagram of the character validity information 34. As shown in the figure, for each character that makes up the E13B character, the horizontal (result of vertical scanning) and vertical (
This numerical value is a numerical representation of the feature (result of horizontal scanning), and this numerical value will be referred to as the intersection feature here. For the intersection feature, raster scanning is performed for each E13B character, and the number of transition points from a white point to a black point (black point block), that is, the number of edge points, is counted.

【0018】例えば、数値文字“0”の場合、水平及び
垂直方向共に、それぞれ“1,2,1 ”といった結果
を得られる。数値文字“5”の場合、水平方向の交差特
徴が“2,3,2 ”となり、垂直方向の交差特徴が“
1”となる。同様に分離文字D1の場合、水平方向の交
差特徴が“1,0,2 ”となり、垂直方向の交差特徴
は“1,2,1,2,1 ”となる。分離文字D3の場
合、水平方向の交差特徴が“1,0,1,0,1 ”と
なり、垂直方向の交差特徴は“1,3,2 ”となる。 予めE13B文字の全てについて、水平及び垂直方向の
交差特徴を求め、文字妥当性情報としてフォーマットテ
ーブル9に記憶しておく。
For example, in the case of the numerical character "0", results such as "1, 2, 1" can be obtained in both the horizontal and vertical directions. For the numerical character “5”, the horizontal intersection feature is “2, 3, 2” and the vertical intersection feature is “2, 3, 2”.
1". Similarly, in the case of the separated character D1, the horizontal intersection feature is "1, 0, 2", and the vertical intersection feature is "1, 2, 1, 2, 1". Separated character In the case of D3, the intersection feature in the horizontal direction is "1, 0, 1, 0, 1", and the intersection feature in the vertical direction is "1, 3, 2". The intersecting features are obtained and stored in the format table 9 as character validity information.

【0019】図8及び図9を参照しながら、交差特徴の
算出方法について説明する。図8は、本発明に係る文字
妥当性判定部31のブロックである。図に示すように、
文字妥当性判定部31には、走査制御部41、エッジカ
ウンタ42、旧エッジレジスタ43、比較器44、水平
方向交差特徴記憶回路45、垂直方向交差特徴記憶回路
46が設けられている。走査制御部41は、Xアドレス
レジスタ6及びYアドレスレジスタ7を制御して、2値
パターンメモリ5上の読取り及び交差特徴記憶する回路
、即ち水平方向交差特徴記憶回路45及び垂直方向交差
特徴記憶回路46の切換を行なうものである。
A method for calculating intersection features will be explained with reference to FIGS. 8 and 9. FIG. 8 is a block diagram of the character validity determination unit 31 according to the present invention. As shown in the figure,
The character validity determination unit 31 is provided with a scan control unit 41, an edge counter 42, an old edge register 43, a comparator 44, a horizontal crossing feature storage circuit 45, and a vertical crossing feature storage circuit 46. The scan control unit 41 controls the X address register 6 and the Y address register 7 to read the binary pattern memory 5 and store the intersection feature, that is, a horizontal intersection feature storage circuit 45 and a vertical intersection feature storage circuit. 46 switching is performed.

【0020】エッジカウンタ42は、2値パターンメモ
リ5の読出し結果から算出したエッジの数を、計数する
カウンタである。旧エッジレジスタ43は、エッジカウ
ンタ42が新たな計数を実施する場合、既にエッジカウ
ンタ42に格納されていた計数結果を記憶するレジスタ
である。比較器44は、エッジカウンタ42及び旧エッ
ジレジスタ43の内容を比較するものである。水平方向
交差特徴記憶回路45は、比較器44の出力する水平方
向の交差特徴を記憶するレジスタ等からなるものである
。垂直方向交差特徴記憶回路46は、比較器44の出力
する垂直方向の交差特徴を記憶するレジスタ等からなる
ものである。
The edge counter 42 is a counter that counts the number of edges calculated from the read result of the binary pattern memory 5. The old edge register 43 is a register that stores the counting results that have already been stored in the edge counter 42 when the edge counter 42 performs new counting. The comparator 44 compares the contents of the edge counter 42 and the old edge register 43. The horizontal direction intersection feature storage circuit 45 is made up of a register and the like that stores the horizontal direction intersection feature output from the comparator 44. The vertical crossing feature storage circuit 46 is made up of a register and the like that stores the vertical crossing feature output from the comparator 44.

【0021】図9に、文字妥当性判定部の動作説明図を
示す。ここでは、数値文字“0”の垂直方向の交差特徴
を求める場合を例に説明する。数値文字“0”は、8×
8の画素で2値パターンメモリ5に格納されているもの
とする。垂直方向の交差特徴を求める場合、ラスタスキ
ャンの主走査を垂直方向に取り、副走査を水平方向に取
る。(水平方向の交差特徴を求める場合は走査方向が逆
になる。)走査制御部41は、まず初めにYアドレスレ
ジスタ7の値を、主走査方向の第1行に設定する。その
後、Xアドレスレジスタ6の値を、副走査方向の第1列
から第8列に向けてインクリメントする。
FIG. 9 shows an explanatory diagram of the operation of the character validity determining section. Here, an example will be explained in which the vertical intersection feature of the numerical character "0" is determined. Numerical character “0” is 8×
It is assumed that 8 pixels are stored in the binary pattern memory 5. When obtaining a vertical intersection feature, the main scan of the raster scan is taken in the vertical direction, and the sub-scan is taken in the horizontal direction. (When determining the intersection feature in the horizontal direction, the scanning direction is reversed.) First, the scanning control unit 41 sets the value of the Y address register 7 to the first row in the main scanning direction. Thereafter, the value of the X address register 6 is incremented from the first column to the eighth column in the sub-scanning direction.

【0022】これにより、エッジカウンタ42は、白点
から黒点への変化を行毎にカウントし(ステップS1)
、比較器44に向けて出力する(ステップS2)。 数値文字“0”の第1行は変化が無いため、エッジカウ
ンタ42の出力は、0となる。エッジカウンタ42の出
力は、旧エッジレジスタ43に格納され、新たな値をエ
ッジカウンタ42が出力するまで、保持される。
As a result, the edge counter 42 counts the change from a white point to a black point for each line (step S1).
, is output to the comparator 44 (step S2). Since there is no change in the first row of numerical characters "0", the output of the edge counter 42 becomes 0. The output of the edge counter 42 is stored in the old edge register 43 and held until the edge counter 42 outputs a new value.

【0023】旧エッジレジスタ43では、エッジカウン
タ42の出力を格納する前に、格納内容を比較器44に
向けて出力する。比較器44では、エッジカウンタ42
の最新の出力と、最新の出力の1走査前の旧出力とを比
較することになる。エッジカウンタ42が第1行のカウ
ント値“0”を出力した場合、比較器44は、旧エッジ
レジスタ43の初期値(無効な値)と第1行のカウント
値を比較することになる。
The old edge register 43 outputs the stored contents to the comparator 44 before storing the output of the edge counter 42 . In the comparator 44, the edge counter 42
The latest output is compared with the old output one scan before the latest output. When the edge counter 42 outputs the first row count value "0", the comparator 44 compares the initial value (invalid value) of the old edge register 43 with the first row count value.

【0024】エッジカウンタ42が第2行のカウント値
“1”を出力した場合、比較器44は、旧エッジレジス
タ43に格納された第1行のカウント値“0”と第2行
のカウント値“1”を比較することになる。比較器44
における比較演算は、まずエッジカウンタ42と旧エッ
ジレジスタ43の出力が一致した場合、無効データを出
力する。そして、エッジカウンタ42と旧エッジレジス
タ43の出力が不一致の場合、エッジカウンタ42から
受入れた値を出力する(ステップS4)。この場合、比
較器44の出力は走査制御部41の制御により、垂直方
向交差特徴記憶回路46に記憶される。
When the edge counter 42 outputs the second row count value "1", the comparator 44 outputs the first row count value "0" stored in the old edge register 43 and the second row count value. "1" will be compared. Comparator 44
In the comparison operation in , first, if the outputs of the edge counter 42 and the old edge register 43 match, invalid data is output. If the outputs of the edge counter 42 and the old edge register 43 do not match, the value accepted from the edge counter 42 is output (step S4). In this case, the output of the comparator 44 is stored in the vertical cross feature storage circuit 46 under the control of the scan control section 41.

【0025】垂直方向交差特徴記憶回路46では、比較
器44の出力の内、無効データ及び値が“0”である先
頭及び最終のデータを削除し、最終的な垂直方向の交差
情報を決定する(ステップS5)。数値文字“0”の場
合、垂直方向の交差特徴は“1,2,1 ”となり、フ
ォーマットテーブル9の文字妥当性情報34として格納
される。数値文字“0”の水平方向の交差特徴を求める
場合も同様に演算され、また他の文字についても予め演
算が実施され、先に図5に示した文字妥当性情報34が
フォーマットテーブル9に用意される。
The vertical intersection feature storage circuit 46 deletes invalid data and the first and last data whose value is "0" from the output of the comparator 44, and determines the final vertical intersection information. (Step S5). In the case of the numerical character "0", the vertical intersection feature is "1, 2, 1" and is stored as character validity information 34 in the format table 9. A similar calculation is performed when determining the horizontal intersection feature of the numeric character "0", and calculations are also performed in advance for other characters, and the character validity information 34 shown in FIG. 5 is prepared in the format table 9. be done.

【0026】次に、帳票1に印刷されたE13B文字の
認識を行なう場合について説明する。図10〜図12は
、本発明に係る第1〜第3のフローチャートである。 なお、2値パターンメモリ5には、帳票1の読取り結果
が格納されているものとする。図10に示すように、閾
値変更制御部33は、予め設定された基準となる2値化
閾値を2値化回路4に設定する(ステップS11)。そ
の後、文字妥当性判定部31が起動し、文字枠29内の
最も左側に位置する黒点ブロックについて、垂直及び水
平方向の交差特徴の演算(第1ブロック特徴抽出)を行
なう(ステップS12)。
Next, a case will be described in which the E13B characters printed on form 1 are recognized. 10 to 12 are first to third flowcharts according to the present invention. It is assumed that the binary pattern memory 5 stores the reading result of the form 1. As shown in FIG. 10, the threshold change control unit 33 sets a preset reference binarization threshold in the binarization circuit 4 (step S11). Thereafter, the character validity determination unit 31 is activated and performs vertical and horizontal intersecting feature calculation (first block feature extraction) for the leftmost black dot block within the character frame 29 (step S12).

【0027】文字妥当性判定部31は、第1ブロック特
徴抽出が完了すると、先に用意された文字妥当性情報3
4との照合判定を行なう(ステップS13)。ステップ
S13の判定がOK、即ち文字妥当性情報34の何れか
と一致した場合には、文字枠29の確定を行なう文字枠
確定処理を行ない(ステップS14)、文字枠の切出し
に係る処理を終了する。ステップS13の結果がNG、
即ち文字妥当性情報34の何れとも一致しない場合には
、図11のステップS21に処理が移る。
[0027] When the first block feature extraction is completed, the character validity determination unit 31 uses the previously prepared character validity information 3.
4 (step S13). If the determination in step S13 is OK, that is, if it matches any of the character validity information 34, a character frame determination process is performed to determine the character frame 29 (step S14), and the process related to cutting out the character frame is ended. . If the result of step S13 is NG,
That is, if it does not match any of the character validity information 34, the process moves to step S21 in FIG. 11.

【0028】ステップS21において文字妥当性判定部
31は、文字枠29内の黒点ブロックが分離文字の一部
であるか否かの判定を行なう。この判定は、黒点ブロッ
ク水平及び垂直方向の交差特徴が“1”で、かつ黒点ブ
ロックの横幅Wが横幅閾値TH以下であるかを判定する
。判定の結果がYESの場合、文字妥当性判定部31は
、ステップS12同様に、文字枠29内の第1ブロック
と第2ブロック(左から2つ目の黒点ブロック)の特徴
抽出を行なう(ステップS22)。
In step S21, the character validity determining unit 31 determines whether the black dot block within the character frame 29 is part of a separated character. This determination determines whether the intersection feature of the black spot block in the horizontal and vertical directions is "1" and the width W of the black spot block is less than or equal to the width threshold TH. If the result of the determination is YES, the character validity determination unit 31 extracts the features of the first block and second block (the second black dot block from the left) in the character frame 29, similarly to step S12 (step S12). S22).

【0029】文字妥当性判定部31は、第1及び第2ブ
ロック特徴抽出が完了すると、先に用意された文字妥当
性情報34との照合判定を行なう(ステップS23)。 ステップS23の判定がOK、即ち文字妥当性情報34
の何れかと一致した場合には、文字枠29の確定を行な
う文字枠確定処理を行ない(ステップS24)、文字枠
の切出しに係る処理を終了する。
When the character validity determination section 31 completes the first and second block feature extraction, it performs a comparison determination with the previously prepared character validity information 34 (step S23). The determination in step S23 is OK, that is, the character validity information 34
If it matches any of the above, a character frame determination process is performed to determine the character frame 29 (step S24), and the process related to cutting out the character frame is ended.

【0030】ステップS21の結果がNOの場合、文字
妥当性判定部31は、閾値変更制御部33を起動し、2
値化回路4の動作結果が白点ブロックの増加、黒点ブロ
ックの減少となるよう2値化閾値を変更し、ステップS
11以降を再度実行する。ステップS23の結果がNG
の場合、即ち文字妥当性情報34の何れとも一致しない
場合には、図12のステップS31に処理が移る。ステ
ップS31において文字妥当性判定部31は、ステップ
S12,S22同様に、文字枠29内の第1及び第2ブ
ロックと第3ブロック(左から3つ目の黒点ブロック)
の特徴抽出を行なう。
If the result of step S21 is NO, the character validity determining unit 31 starts the threshold value change control unit 33, and
The binarization threshold is changed so that the operation result of the digitization circuit 4 is an increase in white dot blocks and a decrease in black dot blocks, and step S
Execute steps 11 and later again. The result of step S23 is NG
In the case of , that is, when there is no match with any of the character validity information 34, the process moves to step S31 in FIG. 12. In step S31, the character validity determination unit 31 determines the first and second blocks and the third block (the third black dot block from the left) in the character frame 29, as in steps S12 and S22.
Perform feature extraction.

【0031】文字妥当性判定部31は、第1〜第3ブロ
ック特徴抽出が完了すると、先に用意された文字妥当性
情報34との照合判定を行なう(ステップS32)。ス
テップS32の判定がOK、即ち文字妥当性情報34の
何れかと一致した場合には、文字枠29の確定を行なう
文字枠確定処理を行ない(ステップS33)、文字枠2
9の切出しに係る処理を終了する。また、ステップS3
2の結果がNGの場合、E13B文字の認識ができない
帳票であるものとして、帳票を排出して返却する等のリ
ジェクト処理を行ない(ステップS34)、E13B文
字認識に係る処理を終了する。
When the character validity determination section 31 completes the first to third block feature extraction, it performs a comparison determination with the previously prepared character validity information 34 (step S32). If the determination in step S32 is OK, that is, if it matches any of the character validity information 34, a character frame confirmation process is performed to confirm the character frame 29 (step S33), and the character frame 29 is confirmed.
9 ends. Also, step S3
If the result of step 2 is NG, it is assumed that the form cannot be recognized with E13B characters, and a reject process such as ejecting and returning the form is performed (step S34), and the processing related to E13B character recognition is ended.

【0032】以上の説明のように、水平及び垂直方向の
交差特徴、即ち文字妥当性情報34を参照して、黒点ブ
ロックがE13B文字として妥当か否かを逐次判定しな
がら文字枠29の決定、即ち切出し処理を行なうため、
印刷濃度の差異により、黒点ブロックの結合や間隔不足
が発生している帳票についても高い精度で認識を行なう
ことができる。本発明は以上の実施例に限定されない。 実施例では、E13B文字の認識を実施する場合を例に
説明したが、分離文字を持つ仮名文字等の認識を実施す
る場合にも適用することができる。
As described above, the character frame 29 is determined by referring to the horizontal and vertical intersection features, that is, the character validity information 34, and sequentially determining whether or not the black dot block is valid as an E13B character. In other words, in order to perform the cutting process,
It is also possible to recognize with high accuracy even forms in which black dot blocks are combined or lack spacing due to differences in print density. The present invention is not limited to the above embodiments. In the embodiment, the case where E13B characters are recognized is explained as an example, but the present invention can also be applied to the case where recognition of kana characters and the like having separated characters is performed.

【0033】[0033]

【発明の効果】以上説明したように本発明によると、文
字として妥当か否かを判定し、必要に応じて2値パター
ンを生成するための閾値を換えて、再度2値パターンの
生成を実施するため、パターンの結合や間隔不足等によ
り1ブロックとして認識してしまう事態を減少させるこ
とができる。このため、分離文字を数値文字として取扱
ってしまう事態も同様に減少させることができる。
[Effects of the Invention] As explained above, according to the present invention, it is determined whether or not it is valid as a character, and if necessary, the threshold value for generating a binary pattern is changed, and the binary pattern is generated again. Therefore, it is possible to reduce the occurrence of recognition as one block due to combination of patterns, insufficient spacing, etc. Therefore, it is possible to similarly reduce the number of situations in which separated characters are treated as numeric characters.

【図面の簡単な説明】[Brief explanation of drawings]

【図1】本発明に係る文字認識装置の概念図である。FIG. 1 is a conceptual diagram of a character recognition device according to the present invention.

【図2】一般的な光学式文字読取り装置の概念図である
FIG. 2 is a conceptual diagram of a general optical character reading device.

【図3】帳票の概念図である。FIG. 3 is a conceptual diagram of a form.

【図4】2値パターンメモリの概念図である。FIG. 4 is a conceptual diagram of a binary pattern memory.

【図5】切出し制御部による補正の説明図である。FIG. 5 is an explanatory diagram of correction by the cutout control unit.

【図6】横幅閾値の説明図である。FIG. 6 is an explanatory diagram of a width threshold.

【図7】文字妥当性情報の説明図である。FIG. 7 is an explanatory diagram of character validity information.

【図8】本発明に係る文字妥当性判定部のブロック図で
ある。
FIG. 8 is a block diagram of a character validity determination unit according to the present invention.

【図9】文字妥当性判定部の動作説明図である。FIG. 9 is an explanatory diagram of the operation of a character validity determination section.

【図10】本発明に係る第1のフローチャートである。FIG. 10 is a first flowchart according to the present invention.

【図11】本発明に係る第2のフローチャートである。FIG. 11 is a second flowchart according to the present invention.

【図12】本発明に係る第3のフローチャートである。FIG. 12 is a third flowchart according to the present invention.

【符号の説明】 8  切出し制御部 9  フォーマットテーブル 31  文字妥当性判定部 32  切出し位置制御部 33  閾値変更制御部 34  文字妥当性情報[Explanation of symbols] 8 Cutting control section 9 Format table 31 Character validity judgment section 32 Cutting position control section 33 Threshold value change control unit 34 Character validity information

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】  媒体上に記載された複数の黒点ブロッ
クから構成された文字を認識するものにおいて、前記黒
点ブロックの2次元的な特徴を検査し、当該黒点ブロッ
クが前記文字を構成するものであるか否かを判定する文
字妥当性判定部と、前記黒点ブロックが前記文字を構成
するものである判定がなされた場合、前記媒体から前記
文字を記載した領域を切出すための文字枠の切出し位置
を特定する切出し位置制御部と、前記黒点ブロックが前
記文字を構成するものでない判定がなされた場合、前記
黒点ブロックを読取ってイメージデータに変換する場合
の閾値を変更する閾値変更制御部とを備えたことを特徴
とする文字認識装置。
Claim 1: A device that recognizes a character composed of a plurality of black dot blocks written on a medium, which inspects two-dimensional features of the black dot blocks and determines whether the black dot blocks constitute the character. a character validity determination unit that determines whether or not the black dot block constitutes the character, and a character frame cutout for cutting out an area in which the character is written from the medium when it is determined that the black dot block constitutes the character; a cutout position control unit that specifies the position; and a threshold change control unit that changes a threshold value when reading the black dot block and converting it into image data when it is determined that the black dot block does not constitute the character. A character recognition device characterized by:
JP3119216A 1991-04-23 1991-04-23 Character recognition device Pending JPH04322390A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3119216A JPH04322390A (en) 1991-04-23 1991-04-23 Character recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3119216A JPH04322390A (en) 1991-04-23 1991-04-23 Character recognition device

Publications (1)

Publication Number Publication Date
JPH04322390A true JPH04322390A (en) 1992-11-12

Family

ID=14755830

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3119216A Pending JPH04322390A (en) 1991-04-23 1991-04-23 Character recognition device

Country Status (1)

Country Link
JP (1) JPH04322390A (en)

Similar Documents

Publication Publication Date Title
US4926492A (en) Optical character reading apparatus and method
US5799115A (en) Image filing apparatus and method
JP3302147B2 (en) Document image processing method
US5101448A (en) Method and apparatus for processing a document by utilizing an image
US4933979A (en) Data reading apparatus for reading data from form sheet
EP0063454B1 (en) Method for recognizing machine encoded characters
US4562594A (en) Method and apparatus for segmenting character images
US4608489A (en) Method and apparatus for dynamically segmenting a bar code
JPH03122773A (en) Image forming device
US5164996A (en) Optical character recognition by detecting geo features
US4962432A (en) Selective retrieval of data from microfilm images of different forms by reading a memory index form cord (bar code) recorded on each image frame
JP2845370B2 (en) Character recognition method
JPH04322390A (en) Character recognition device
JP3710164B2 (en) Image processing apparatus and method
JP2747136B2 (en) Character recognition device
JP2708604B2 (en) Character recognition method
JP3084833B2 (en) Feature extraction device
JP2993533B2 (en) Information processing device and character recognition device
JP2001126025A (en) For ocr format parameter generation method
JPS6343788B2 (en)
JP3277977B2 (en) Character recognition method
JPH08235311A (en) Character recognition device
JPH0443476A (en) Character recognizing device
JPH08297719A (en) Character recognition method and device therefor
JPH02297688A (en) Character recognizing device