JPH0516632B2 - - Google Patents

Info

Publication number
JPH0516632B2
JPH0516632B2 JP59148725A JP14872584A JPH0516632B2 JP H0516632 B2 JPH0516632 B2 JP H0516632B2 JP 59148725 A JP59148725 A JP 59148725A JP 14872584 A JP14872584 A JP 14872584A JP H0516632 B2 JPH0516632 B2 JP H0516632B2
Authority
JP
Japan
Prior art keywords
character
normalized
characters
size
normalization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59148725A
Other languages
Japanese (ja)
Other versions
JPS6132187A (en
Inventor
Makoto Kato
Hirohisa Sone
Hiroyasu Takahashi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP14872584A priority Critical patent/JPS6132187A/en
Publication of JPS6132187A publication Critical patent/JPS6132187A/en
Publication of JPH0516632B2 publication Critical patent/JPH0516632B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】[Detailed description of the invention]

[産業上の利用分野] 本発明は文字認識方式に関し、更に詳細にいえ
ば、促音、拗音を含む手書きを文字を複数のタイ
プに類別して正規化するようにした文字認識方式
に関する。 [従来技術] 最近は、OA化の波の中で、日本語情報処理シ
ステムが種々開発されているが、日本語情報処理
システムで大きなネツクになつているのはデータ
入力の部分である。これまで、日本語入力方式と
して、タブレツト方式、キータツチ方式、キーボ
ードを用いた仮名−漢字変換方式などに提案さ
れ、ある程度成功をおさめているが、一般に入力
速度の点で問題があり、例えば統計調査などの大
量データの入力には不向きである。従つて、
OCRによる文字認識、特に手書き文字認識は日
本語データ入力方式の一翼を担うものとして大い
に期待されている。 特に今後は、OCR装置をOA機器と組合わせ、
手書き文字をOCRで読取つて表示し編集し処理
しプリントするアプリケーシヨンが盛んになると
考えられるが、このようなアプリケーシヨンでは
大文字と促拗音とを明確に区別し認識処理できる
機能を持つことが不可欠であると考えられる。 しかしながら従来の英数字・仮名用のOCRで
は、通常、仮名の大文字と小文字(促拗音)の区
別がなく、同じ字形の大文字と小文字とを同一の
文字として処理している。また、これまでの手書
き漢字OCRは住所、氏名などを読取るアプリケ
ーシヨンが主体であつたため、促拗音の認識につ
いてはあまり考慮されていなかつた。 大文字と小文字を区別するための1つの方法と
しては、入力文字パターンの大きさ、位置を判定
し、この情報を1つの特徴データとして利用して
分類識別を行なう方法が考えられるが、この方法
は文字の大きさ及び位置を付加的な特徴データと
して用いなければならないため、認識処理が複雑
になり、ハードウエア化しにくく、また認識時間
も長くなりやすいという問題がある。 また一般に、OCRによる手書き文字の認識は、
文字読取り、前処理、特徴抽出、分類識別という
手順で行なわれ、前処理では入力文字パターンの
大きさの正規化を行なうが、大文字、小文字を意
識しない従来のOCRではすべての入力文字パタ
ーンを画一的に正規化するのが普通である。画一
的正規化を用いた場合は、もともと小さな寸法を
有する小文字あるいはピリオド、コンマなどの記
号を不必要に拡大するため、無駄な処理を含むだ
けでなく、線の微小な凹凸など無用な特性を拡大
し、また認識対象としての文字パターンのデータ
量を不必要に増やすことになるため、特徴抽出、
分類識別でのデータ処理量が増えるという問題が
ある。 特開昭55−10624号公報は大文字英字、数字、
特殊記号の識別を行なう文字識別処理方法を示し
ている。この処理方法では、先ず第1ステツプで
ピリオド、コンマなどの背丈の低い特殊記号を分
離してそのまま識別を行ない、残つたものについ
て高さの正規化を行なつて、大分類、識別を行な
い、次に、更に残つたものについて幅の正規化を
行なつて更に大分類、識別を行なうようにしてい
る。この特開昭は文字の高さと幅の正規化を区別
して用いているが、これは前の識別結果に基いて
段階的に一定の大きさに正規化するものであつ
て、本発明のように入力文字パターンの大きさ、
位置に基づいて異なる大きさ、位置に正規化する
ことは示しておらず、また大文字、促拗音の識別
についても示していない。 [発明が解決しようとする問題点] したがつて本発明の目的は、認識処理を複雑に
することなく、簡単に且つ高速に、大文字と小文
字(特に促拗音)を区別して認識できるようにす
ることである。 [問題点を解決するための手段] 本発明は、前処理の正規化の段階で、入力文字
の大きさ及び位置の要素に基いて入力文字を複数
のタイプに類別し正規化するものである。即ち、
読取つた2値化入力文字パターンの大きさと位置
に基いて入力文字を通常文字、促拗音などの複数
のタイプに類別し、各タイプ毎に、大きさ及び位
置の少なくとも一方を異ならせて正規化イメージ
領域に正規化し、そしてこの正規化イメージ領域
全体を対象として特徴抽出するようにしたもので
ある。したがつて本発明によれば、入力文字パタ
ーンの大きさと位置のパラメータは正規化された
文字パターンそのものの中に内在することになる
ため、以後の特徴抽出、分類 識別の処理では、
入力文字の大きさ、位置のパラメータを考慮する
必要がなくなる。したがつてすべての文字カテゴ
リーに対して統一的認識アルゴリズムを使用で
き、特徴抽出、分類識別処理が簡単になり、認識
速度を高めることができる。また、すべての文字
カテゴリーに対して同一の認識処理の使用が可能
となるため、文字認識システムのハードウエア化
が容易であり、一層認識速度を高めることが可能
となる。 [実施例] 次に図面を参照して本発明の良好な実施例につ
いて説明する。 第1図は本発明による文字認識方式の機能的ブ
ロツク図である。先ず、文字読取り部では、帳票
に手書きされた文字がOCRスキヤナによつて読
取られる。この例では、帳票は10mm×10mmの文字
枠のものが用いられた。読取られた2値化文字パ
ターンデータは一旦メモリにドツト・パターンと
して入れられ、文字切出し部で文字枠部分が切出
される。OCRスキヤナの解像度を8ドツト/mm
とすると、切出された文字枠の大きさは80×80ド
ツトとなる。外周検出部では、第2図に示すよう
に、切出した入力文字パターンに外接する長方形
のX、Y座標の最小値と最大値(Xmin、Xmax、
Ymin、Ymax)が検出される。切出した文字枠
の左上の角の座標が(0、0)にされている。上
記の文字読取り、文字切出し、外周検出は周知の
一般的処理であるから、これらについての詳しい
説明は省略することにする。 第1図は正規化分類部及び正規化部が本発明に
よつて改良された部分である。 正規化分類部は外周検出部によつて得られた外
接長方形のXmax、Xmin、Ymax、Yminに基づ
いて以下の如くX、Y方向の幅及びX、Y方向の
重心を求める。 X方向幅ΔX=Xmax−Xmin+1 Y方向幅ΔY=Ymax−Ymin+1 X方向重心Gx=1/2(Xmax+Xmin) Y方向重心Gy=1/2(Ymax+Ymin) そして正規化分類部は、求められた入力文字パ
ターンの大きさ及び位置に基づいて入力文字を複
数のタイプに類別する。下表1は、読取りスキヤ
ナの解像度を8ドツト/mm、文字枠を80×80ドツ
トとしたときの分類の一例を示している。
[Industrial Field of Application] The present invention relates to a character recognition system, and more specifically, to a character recognition system that classifies and normalizes handwritten characters including consonants and consonants into a plurality of types. [Prior Art] Recently, with the wave of OA, various Japanese information processing systems have been developed, but the major bottleneck in Japanese information processing systems is data input. Until now, various Japanese input methods have been proposed, such as the tablet method, key touch method, and kana-to-kanji conversion method using a keyboard, and have achieved some degree of success. It is not suitable for inputting large amounts of data such as Therefore,
Character recognition using OCR, especially handwritten character recognition, is highly expected to play a role in Japanese data input methods. In particular, in the future, OCR devices will be combined with OA equipment,
Applications that use OCR to read handwritten characters, display them, edit them, process them, and print them are likely to become popular, but it is essential for such applications to have the ability to clearly distinguish between capital letters and accents, and to recognize and process them. It is thought that. However, conventional OCR for alphanumeric characters and kana usually does not distinguish between uppercase and lowercase letters (press sounds) of kana, and processes uppercase and lowercase letters of the same shape as the same character. Furthermore, since the handwritten kanji OCR to date has mainly been used for applications such as reading addresses and names, little consideration has been given to the recognition of accentuated sounds. One possible method for distinguishing between uppercase and lowercase letters is to determine the size and position of the input character pattern and use this information as feature data for classification and identification. Since the size and position of the characters must be used as additional feature data, there are problems in that the recognition process becomes complicated, difficult to implement in hardware, and the recognition time tends to be long. In general, handwritten character recognition using OCR is
It is performed through the steps of character reading, preprocessing, feature extraction, and classification identification.The preprocessing normalizes the size of the input character pattern, but in conventional OCR, which does not consider uppercase or lowercase letters, all input character patterns are It is common to normalize all at once. When uniform normalization is used, lowercase letters or symbols such as periods and commas that originally have small dimensions are unnecessarily enlarged, which not only involves unnecessary processing but also eliminates unnecessary characteristics such as minute irregularities in lines. , and unnecessarily increases the amount of character pattern data to be recognized.
There is a problem that the amount of data processing for classification identification increases. JP-A No. 55-10624 uses uppercase letters, numbers,
A character identification processing method for identifying special symbols is shown. In this processing method, first, in the first step, short special symbols such as periods and commas are separated and identified as they are, and the remaining symbols are normalized in height and then roughly classified and identified. Next, the width of the remaining items is normalized for further classification and identification. This patent application uses the normalization of character height and width separately, but this is normalization to a constant size in stages based on the previous identification result, and unlike the present invention, the size of the input character pattern,
It does not show normalization to different sizes and positions based on position, nor does it show the identification of capital letters and accents. [Problems to be Solved by the Invention] Therefore, an object of the present invention is to easily and quickly distinguish between uppercase and lowercase letters (especially accents) and to recognize them without complicating the recognition process. That's true. [Means for Solving the Problems] The present invention classifies and normalizes input characters into a plurality of types based on the size and position of the input characters at the normalization stage of preprocessing. . That is,
Based on the size and position of the read binary input character pattern, the input characters are classified into multiple types such as regular characters and accent sounds, and normalized by making at least one of the size and position different for each type. The image area is normalized, and features are extracted from the entire normalized image area. Therefore, according to the present invention, the size and position parameters of the input character pattern are inherent in the normalized character pattern itself, so in the subsequent feature extraction, classification, and identification processes,
There is no need to consider parameters such as the size and position of input characters. Therefore, a unified recognition algorithm can be used for all character categories, simplifying feature extraction and classification/identification processing, and increasing recognition speed. Furthermore, since the same recognition process can be used for all character categories, it is easy to implement the character recognition system in hardware, and the recognition speed can be further increased. [Example] Next, a preferred example of the present invention will be described with reference to the drawings. FIG. 1 is a functional block diagram of a character recognition system according to the present invention. First, in the character reading section, characters handwritten on a form are read by an OCR scanner. In this example, the form used had a 10mm x 10mm character frame. The read binary character pattern data is temporarily stored in a memory as a dot pattern, and a character frame portion is cut out by a character cutting section. Increase OCR scanner resolution to 8 dots/mm
Then, the size of the cut out character frame will be 80 x 80 dots. The outer circumference detection section detects the minimum and maximum values (Xmin, Xmax,
Ymin, Ymax) are detected. The coordinates of the upper left corner of the cut out character frame are set to (0, 0). Since the above-mentioned character reading, character cutting, and outer circumference detection are well-known general processes, a detailed explanation thereof will be omitted. FIG. 1 shows the normalization classification section and normalization section improved by the present invention. The normalization classification section calculates the width in the X and Y directions and the center of gravity in the X and Y directions as follows based on the Xmax, Xmin, Ymax, and Ymin of the circumscribed rectangle obtained by the perimeter detection section. X-direction width ΔX = Xmax-Xmin+1 Y-direction width ΔY = Ymax-Ymin+1 X-direction center of gravity Gx = 1/2 (Xmax + Xmin) Y-direction center of gravity Gy = 1/2 (Ymax + Ymin) Classifying input characters into multiple types based on pattern size and position. Table 1 below shows an example of classification when the resolution of the reading scanner is 8 dots/mm and the character frame is 80 x 80 dots.

【表】 表1において、重心Gxの欄の「左部」は文字
枠をX方向に3等分したときの左部を表わし、重
心Gyの欄の「上部」、「中部」、「下部」は文字枠
をY方向に3等分したときの、上部、中部、下部
を表わす。また、空白の欄は“don′t care”であ
る。ΔX、ΔY、Gx、Gyの4つの条件(空白の欄
は除く)が満たされた場合、それに対応するタイ
プ番号が選択される。 ここで、上記10個のタイプの意味について説明
する。この例では、JIS C6235日本語入力用文字
盤配列に含まれる漢字、仮名、促拗音、英字大文
字(小文字除く)、数字、及び特殊文字の一部を
基本の認識対象としているが、任意の選択した文
字あるいは記号の組合わせを使用しその位置、大
きさに基いて種々タイプ分けできることは理解さ
れよう。タイプ1は文字枠の上部に小さく書かれ
る単一引用符「‘」、「’」などの特殊文字用、タ
イプ2は枠の中央部に小さく書かれる中点「・」
などの特殊文字用、タイプ3は枠の下部に小さく
書かれるピリオド「.」などの特殊文字用である。
タイプ4は枠の上部にやや大きく書かれる2重引
用符「“」、「”」などの特殊文字用、タイプ5は枠
の中央部に書かれる漢字の繰り返し記号「〃」
用、タイプ6は促拗音、句読点などのためのもの
である。タイプ7は漢字の「」、感嘆符「!」、
コロン「:」、数字の「1」など縦長の文字のた
めのものであり、タイプ8は漢字のイチ「一」、
負符号「−」などのためのものであり、タイプ9
はアンダライン「 」用である。タイプ10はその
他の漢字、英字大文字、仮名大文字、数字、及び
「%」、「¥」などの大きめの特殊文字用である。
タイプ5はタイプ4、6よりも小さな寸法にされ
ているが、これは、文字枠の中央部に記入した文
字は多少小さめでも通常文字である可能性が高
く、これらの通常文字がタイプ5の繰り返し記号
「〃」として分類されるのを防止するためである。 例えば数字「1」のようにタイプ7及びタイプ
10の両方に該当する場合が生じうるが、この場合
はプライオリテイ・エンコーダによつてタイプ番
号の若い方を優先させる。 また、特殊文字及び促拗音では、大きさと文字
枠内の位置が重要な要素となる。したがつて、帳
票記入に当つては、記入者に対し記入要領のガイ
ドを与えておくのが望ましいが、このタイプ分け
の場合は、「促拗音、句読点は文字枠の左下隅に
1/4程度の大きさで記す」及び「特殊文字はその
種類に応じて文字枠内の上部、中部、下部に区別
して記す」程度のガイドを与えれば十分である。 第1図の正規化部は、正規化分類部において判
定された入力文字のタイプに応じて入力文字を、
タイプ毎に大きさ及び位置の少なくとも一方を異
ならせて所定の正規化イメージ領域に正規化す
る。この例では、切出された80×80ビツトの文字
枠内の2値化文字パターンを64×64ビツトの正規
化イメージ領域に正規化するものとしている。第
3図は、各タイプの文字が64×64ビツトの正規化
イメージ領域にどのように正規化されるかを例示
している。斜線の部分は正規化されたイメージが
書込まれる領域を示し、その回りの白地の部分は
白イメージ領域を示している。タイプ1〜6は小
文字サイズの文字を対象としており、タイプ1〜
6では正規化サイズ30が用いられ、タイプ7〜10
では正規化サイズ60が用いられる。但し、細長い
文字パターンのタイプ1、2、3、7、8、9で
は、これらの文字パターンを30×30または60×60
に正規化すると、細長いという形状上の特性が失
われ、特に正規化後細線化する場合は、長さ方向
の線縁の微小凹凸が拡大によつて強調され、本来
の特徴を歪めることになるので、タイプ1、2、
3、7ではΔXの値をそのまま用い、タイプ8、
9ではΔYの値をそのまま用いて正規化してい
る。 上記のように正規化した後、正規化された文字
パターンは、特徴抽出部において、まわりの白地
を含めた64×64ビツトの正規化イメージ領域全体
を対象として特徴抽出される。次に、分類識別部
において、抽出された特徴と、同様に正規化され
た標準文字パターンについての予じめ用意した特
徴とのパターン・マツチングが行なわれ、入力文
字パターンの識別が行なわれる。特徴抽出の手法
としては、一定の正規化イメージ領域の中に正規
化した文字パターンの大きさ、位置の差が、この
正規化イメージ領域全体を対象として特徴抽出し
たときに特徴の差として反映するものであれば、
即ち、特徴が大きさ及び位置に依存するものであ
れば、任意のものを使用できる。従来公知のもの
としては、X方向、Y方向または斜め方向から見
たときの位置別あるいは区画別の黒ドツトの数ま
たは分布状態を求める方法、細線化した文字パタ
ーンの方向別、区画別の水平、垂直、斜め方向の
黒ドツト連結数を求める方法、上下左右の各辺か
ら文字パターンまでの白ドツトの数(深さ)また
は一定の深さまでの白ドツトの総数(面積)を求
める方法などが知られているが、一例としては方
向別、区画別の黒ドツト連結数及び各辺に沿つた
白領域の面積を求める特開昭58−201184公報があ
る。これらの特徴抽出、分類識別の処理自体はパ
ターン・マツチング的な認識手法において一般的
なものであるので、詳しい説明は省略する。必要
があれば、上記特開昭を参照されたい。 次に、第4図を参照して本発明による良好な正
規化機構について説明する。タイプ・セレクタ1
0は第1図の正規化分類部に対応し、その他の部
分は第1図の正規化部に対応する。タイプ・セレ
クタ10は10mm×10mm(80×80ドツト)の文字枠
内の入力文字パターン外接長方形の座標値、
Ymin、Ymax、Xmin、Xmaxに基づいて、入力
文字のタイプ(表1のタイプ1〜タイプ10)を判
別し、各タイプに応じて正規化に必要な制御信号
を発生する。これらの制御信号は以後明らかとな
ろう。 正規化機構は正規化ROM18、28、128×128ビ
ツトのイメージ・バツフア22、及び正規化イメ
ージ領域となる64×64ビツトの正規化イメージ・
バツフア52を有する。イメージ・バツフア22
は切出された文字枠の入力文字パターンを含む。
入力文字パターンは、イメージ・バツフア22の
左上の角の座標を(0、0)としたとき、文字枠
の左上の角を座標(0、0)に合わせて記憶され
ている。アドレツシングを容易にするためイメー
ジ・バツフア22は128×128ビツトにされている
が、文字枠を含む大きさであれば任意の大きさで
よい。 この正規化機構の目的は、入力文字の判別され
たタイプに応じて入力文字パターンを第3図に示
す所定の大きさ及び位置に正規化して正規化イメ
ージ・バツフア52に記憶することである。正規
化ROM18,28はそれぞれ2つの正規化用マ
トリクスA,Bを有し、マトリクスAは正規化サ
イズ30用、マトリクスBは正規化サイズ60用であ
る。マトリクスA,Bは判別されたタイプに応じ
てタイプ・セレクタ10によつて選択される。正
規化ROM18,28の働きは、イメージ・バツ
フア22の文字パターンを縮小/拡大により正規
化サイズ30または60に正規化してバツフア52に
記憶する場合、文字パターンの大きさに応じて、
文字パターンのどのドツトを正規化バツフア52
に書込むかを指示するアドレスを発生することで
ある。縮小の場合は間引いて読取られ、拡大の場
合は選択された同じドツトが反復して読取られ、
あるいは場合によつては拡大/縮小なしにそのま
まイメージ・バツフア22から出力される。 そのために、YminとYmax(それぞれ7ビツ
ト)は減算器12に与えられ、その出力(ΔY−
1)はマルチプレクサMPX14のA入力を介し
て、ROM18の行位置(Y位置)を選択する上
位アドレス(H)に与えられる。ROM18の列位置
(X位置)を選択する下位アドレス(L)はアドレ
ス・カウンタ30の上位ビツト26〜211から与え
られる。MPX14のB入力“59”は正規化サイ
ズ60の場合にタイプ・セレクタによつて選択さ
れ、これはイメージ・バツフア22の文字パター
ンをY方向拡大比率=1でそのまま出力する場合
に用いられる。正規化ROM18の出力は文字パ
ターン外接長方形におけるYアドレスを示すた
め、ROM18の出力は加算器20でYminと加
算され、イメージ・バツフア22を実際にアドレ
スするためのYアドレスに変換される。 同様に、XminとXmax(それぞれ7ビツト)は
減算器24に与えられ、その出力(ΔX−1)は
マルチプレクサMPX26のA入力を介して、
ROM28の行位置(Y位置)を選択する上位ア
ドレス(H)に与えられる。ROM28の列位置(X
位置)を選択する下位アドレス(L)はアドレス・カ
ウンタ30の下位ビツト20〜25から与えられる。
MPX26のB入力“59”は正規化サイズ60の場
合にイメージ・バツフア22の文字パターンをX
方向拡大比率=1でそのまま出力するときタイ
プ・セレクタ10によつて選択される。MPX2
6のC入力“29”は正規化サイズ30の場合にイメ
ージ・バツフア22の文字パターンをX方向拡大
比率=1で出力するときタイプ・セレクタ10に
よつて選択される。ROM28の出力も外接長方
形におけるXアドレスを示すため、加算器32で
Xminと加算され、イメージ・バツフア22を実
際にアドレスするためのXアドレスに変換され
る。 ここで、第5図を参照して正規化ROMマトリ
クスの構成について説明する。この例では、説明
を簡単にするため、文字枠の寸法を10×10ビツト
(第5図A)、正規化サイズを4×4ビツト(第5
図B)としたときの正規化ROMマトリクス18
または28(第5図C)の構成を示している。 正規化マトリクスの第k行、第l列の要素Ekl
の値は Ekl=INT(k×l/L+0.5) で求められるものである。ここで、Lはアドレ
ス・インデツクスのとりうる最大値(第5図Cで
は3)であり、INT(x)はxの整数部分であ
る。行位置の0〜9はΔX−1またはΔY−1に
対応するサイズ・インデツクスであり、正規化マ
トリツクスの上位アドレスに相当する。列位置の
0〜3は正規化マトリツクスの下位アドレスに相
当する。 一般に、X方向に正規化するためのマトリクス
の行数は文字枠のX方向のビツト数(第5図の場
合は10)、列数は正規化サイズのX方向のビツト
数(第5図の場合は4)に等しく、Y方向に正規
化するためのマトリクスの行数は文字枠のY方向
のビツト数(第5図の場合は10)、列数は正規化
サイズのY方向のビツト数(第5図の場合は4)
に等しい、従つて、第4図の実際例では正規化マ
トリクス18A,28Aの行数は80、列数は30に
され、正規化マトリクス18B,28Bの行数は
80、列数は60にされる。 第5図の場合、文字枠及び正規化サイズのX、
Y方向のビツト数は等しいから、第5図Cの正規
化マトリクスはX、Y方向で共用できる。動作に
おいて、例えば、入力文字パターンのX方向の寸
法Xmax−Xmin=ΔX−1(サイズ・インデツク
ス)が2の場合は、X正規化マトリクスの値0、
1、1、2が読取られ、したがつてXアドレス=
1が2回発生されて拡大される。サイズ・インデ
ツクス=3では外接長方形のX方向の寸法=X方
向の正規化サイズであり、拡大比率1に相当す
る。サイズ・インデツクス=9の場合はXアドレ
ス=0、3、6、9が発生され、間引き読取りが
行なわれる。Y方向正規化マトリクスも同様に動
作する。 しかし正規化マトリクスは外接長方形の左上の
角のアドレスを(0、0)として文字パターンを
正規化サイズに変換するアドレスを発生するの
で、イメージ・バツフア22をアクセスするため
の実際のX、YアドレスAx、Ayは次式によつて
与えられる。 Ax=Xmin+マトリクス(ΔX−1、ix) Ay=Ymin+マトリクス(ΔY−1、iy) ここで、マトリクス(ΔX−1、ix)、マトリ
クス(ΔY−1、iy)はそれぞれΔX−1、ΔY−
1をサイズ・インデツクス、ix、iyをアドレス・
インデツクスとして得られるマトリクス値であ
る。第4図の加算器20,32はこの加算を行な
う。 したがつて、64×64ビツトの正規化バツフア5
2を用いる第4図の場合正規化ROM18,28
は4096回=(=64×64)アドレス信号を発生して
イメージ・バツフア22を読取る。しかし、第3
図のように正規化して正規化バツフア52に書込
むためには一工夫が必要である。比較器CMP4
2,44及び加算器46,48はそのためのもの
である。 先ず、第6図を参照して原理を説明する。正規
化バツフア52のX、YアドレスAnx、Anyを次
式によつて与えるものとする。 Anx=ixαx Any=iyαy ここで、は2進数(第6図では2ビツト、第
4図では6ビツト)の加算で、オーバフローを無
視したものを示す。したがつて、例えばαx=0、
αy=0で第6図Aのように書込まれるデータは、
αx=1、αy=2とした場合は第6図Bのように
(1、2)を始点としてラツプアラウンドして書
込むことができ、またix>1、iy>1で書込むデ
ータをマスクすれば第6図Cのように書込まれる
ことになる。即ち、αx、αyで正規化バツフア5
2の書込み始点を指定し、ix>limx、iy>limy
で書込みデータをマスクすればイメージ・バツフ
ア22の読取り出力を正規化バツフア52の任意
の位置に、任意の大きさでマスクして書込むこと
ができる。このときの限界値limx、limyをリミ
ツト・カウント値とする。 加算器46,48及び比較器42,44は上記
の原理で正規化バツフア52への書込みを制御す
るものである。加算器46,48は一方の入力と
して上記のiy、ixに相当するアドレスをアドレ
ス・カウンタ30から受取り、他方の入力として
αy、αxに相当するアドレスをマルチプレクサ
MPX38,40から受取る。タイプ・セレクタ
10はMPX38,40を制御し、判別されたタ
イプに応じて、対応する始点アドレスαx(2、
17、23または27)、αy(2、17、25、32または47)
を加算器48,46へゲートする。加算器46は
正規化バツフア52のYアドレスを選択する上位
アドレス(H)を与え、加算器48はXアドレスを選
択する下位アドレス(L)を与える。したがつてイメ
ージ・バツフア22から読取られたドツト・デー
タは始点(αx、αy)から書込まれる。 比較器42,44は一方の入力としてiy、ixに
対応するアドレスをアドレス・カウンタ30から
受取り、他方の入力としてリミツト・カウント値
をマルチプレクサMPX34,36から受取る。
タイプ・セレクタ10は判別されたタイプに応じ
てリミツト・カウント値をMPX34,36へゲ
ートする。比較器CMP42,44はiy、ixがリ
ミツト・カウント値以下のときANDゲート50
を付勢し、リミツト・カウント値を超えたとき
ANDゲート50を禁止する。なお、タイプ・セ
レクタ10の出力“2”、“17”、“23”、“25”、
“27”、“29”、“32”、“47”、“59”、“ΔX−1
”、
“ΔY−1”、はタイプ判別に応じてこれらの出力
が発生されたとき、MPX14、26、34、36、38、
40を制御して対応番号の入力を選択するものであ
る。 下表2は各タイプ1〜10の正規化で用いられる
ROMマトリクス(正規化サイズ30用……A、正
規化サイズ60用……B)、サイズ・インデツクス
(X、Y)、リミツト・カウント値(X、Y)、始
点(X、Y)を示している。
[Table] In Table 1, "left part" in the column for center of gravity Gx represents the left part when the character frame is divided into three equal parts in the X direction, and "upper", "middle", and "lower" in the column for center of gravity Gy represents the upper, middle, and lower parts when the character frame is divided into three equal parts in the Y direction. Also, a blank column means "don't care." If the four conditions ΔX, ΔY, Gx, and Gy (excluding blank columns) are satisfied, the corresponding type number is selected. Here, we will explain the meanings of the above 10 types. In this example, the basic recognition targets are kanji, kana, kanji, uppercase letters (excluding lowercase letters), numbers, and some special characters included in the JIS C6235 Japanese input dial layout. It will be appreciated that various types can be created based on location and size using combinations of letters or symbols. Type 1 is for special characters such as single quotation marks "'" and "'" written in small letters at the top of the text frame, and Type 2 is for special characters such as single quotation marks "'" and "'" written in small letters at the center of the frame.
Type 3 is for special characters such as a period "." written in small size at the bottom of the frame.
Type 4 is for special characters such as double quotation marks "", "'', which are written slightly larger at the top of the frame, and type 5 is for special characters such as double quotation marks "" and "'', which are written in the center of the frame.
Type 6 is for accents, punctuation marks, etc. Type 7 is the kanji "", exclamation mark "!",
Type 8 is for vertically long characters such as the colon ":" and the number "1", and type 8 is for the kanji ichi "ichi",
It is for negative sign "-" etc., type 9
is an underline ” is for. Type 10 is for other kanji, uppercase English letters, uppercase kana letters, numbers, and larger special characters such as "%" and "\".
Type 5 has smaller dimensions than Types 4 and 6, but this is because the characters written in the center of the character frame are likely to be regular characters even if they are a little smaller, and these regular characters are smaller than Type 5. This is to prevent it from being classified as a repeating symbol "〃". For example, type 7 and type like the number "1"
A case may occur where both of the above 10 apply, but in this case, the priority encoder gives priority to the one with the smaller type number. Furthermore, for special characters and accentuated sounds, the size and position within the character frame are important factors. Therefore, when filling in forms, it is desirable to give the filler a guide on how to fill in the forms, but in the case of this type classification, it is recommended to It is sufficient to provide guides such as "Special characters should be written in appropriate sizes" and "Special characters should be written separately at the top, middle, and bottom of the character frame depending on their type." The normalization unit in FIG. 1 converts input characters into
At least one of size and position is made different for each type and normalized to a predetermined normalized image area. In this example, the binarized character pattern within the extracted 80 x 80 bit character frame is normalized to a 64 x 64 bit normalized image area. FIG. 3 illustrates how each type of character is normalized into a 64 x 64 bit normalized image area. The hatched area indicates the area where the normalized image is written, and the white area around it indicates the white image area. Types 1 to 6 are for lowercase sized characters;
6 uses a normalized size of 30, types 7 to 10
In this case, a normalized size of 60 is used. However, for types 1, 2, 3, 7, 8, and 9 of elongated character patterns, these character patterns are 30x30 or 60x60.
When normalized to , the shape characteristic of elongation is lost, and especially when thinning the line after normalization, minute irregularities on the line edge in the length direction are emphasized by enlarging, distorting the original characteristics. Therefore, types 1, 2,
In 3 and 7, the value of ΔX is used as is, and in type 8,
9, the value of ΔY is used as is for normalization. After being normalized as described above, the normalized character pattern is subjected to feature extraction in the feature extraction section from the entire 64×64 bit normalized image area including the surrounding white background. Next, in the classification identification section, pattern matching is performed between the extracted features and features prepared in advance for standard character patterns that have been similarly normalized, and the input character pattern is identified. As a feature extraction method, differences in the size and position of normalized character patterns within a certain normalized image area are reflected as feature differences when features are extracted from the entire normalized image area. If it is something,
That is, any feature that is size and position dependent can be used. Conventionally known methods include methods for determining the number or distribution of black dots by position or by section when viewed from the X direction, Y direction, or diagonal direction, and methods for determining the number or distribution of black dots by position or by section when viewed from the , how to find the number of connected black dots in vertical and diagonal directions, how to find the number of white dots from each side (top, bottom, left and right) to the character pattern (depth), or the total number of white dots (area) up to a certain depth. This is known, but one example is Japanese Patent Application Laid-Open No. 58-201184, which calculates the number of connected black dots for each direction and section and the area of a white region along each side. These feature extraction and classification/identification processes themselves are common in pattern matching-type recognition methods, so detailed explanations will be omitted. If necessary, please refer to the above-mentioned JP-A-Sho. Next, a good normalization mechanism according to the present invention will be explained with reference to FIG. Type selector 1
0 corresponds to the normalization classification section in FIG. 1, and the other sections correspond to the normalization section in FIG. The type selector 10 is the coordinate value of the input character pattern circumscribing rectangle within the 10 mm x 10 mm (80 x 80 dots) character frame,
Based on Ymin, Ymax, Xmin, and Xmax, the type of input character (type 1 to type 10 in Table 1) is determined, and a control signal necessary for normalization is generated according to each type. These control signals will become clear later. The normalization mechanism includes a normalization ROM 18, 28, 128 x 128 bit image buffer 22, and a 64 x 64 bit normalization image area which is the normalization image area.
It has a buffer 52. image battle 22
contains the input character pattern of the cut out character frame.
The input character pattern is stored with the upper left corner of the character frame aligned with the coordinates (0, 0) when the coordinates of the upper left corner of the image buffer 22 are (0, 0). The image buffer 22 is set to 128 x 128 bits to facilitate addressing, but it may be of any size as long as it includes the character frame. The purpose of this normalization mechanism is to normalize the input character pattern to a predetermined size and position shown in FIG. 3 in accordance with the determined type of input character and store it in the normalized image buffer 52. The normalization ROMs 18 and 28 each have two normalization matrices A and B, where matrix A is for normalized size 30 and matrix B is for normalized size 60. Matrices A and B are selected by the type selector 10 according to the determined type. The functions of the normalization ROMs 18 and 28 are such that when a character pattern in the image buffer 22 is normalized to a normalized size of 30 or 60 by reduction/enlargement and stored in the buffer 52, depending on the size of the character pattern,
Normalize buffer 52 which dots in the character pattern
It is to generate an address that indicates what to write to. In the case of reduction, the dots are thinned out and read, and in the case of enlargement, the same selected dots are read repeatedly,
Alternatively, in some cases, the image may be outputted from the image buffer 22 as it is without being enlarged/reduced. For this purpose, Ymin and Ymax (7 bits each) are given to the subtracter 12, and its output (ΔY−
1) is applied to the upper address (H) that selects the row position (Y position) of the ROM 18 via the A input of the multiplexer MPX14. The lower address (L) for selecting the column position (X position) of the ROM 18 is given from the upper bits 26 to 211 of the address counter 30. The B input "59" of the MPX 14 is selected by the type selector when the normalized size is 60, and is used when the character pattern of the image buffer 22 is output as is with the Y direction enlargement ratio=1. Since the output of the normalization ROM 18 indicates the Y address in the character pattern circumscribing rectangle, the output of the ROM 18 is added to Ymin in the adder 20 and converted into a Y address for actually addressing the image buffer 22. Similarly, Xmin and Xmax (7 bits each) are given to the subtracter 24, whose output (ΔX-1) is passed through the A input of the multiplexer MPX26 as
It is given to the upper address (H) that selects the row position (Y position) of the ROM 28. ROM28 column position (X
The lower address (L) for selecting the location) is given from lower bits 20 to 25 of address counter 30.
The B input “59” of MPX26 converts the character pattern of image buffer 22 to X when the normalized size is 60.
This is selected by the type selector 10 when outputting as is with the direction enlargement ratio=1. MPX2
The C input "29" of No. 6 is selected by the type selector 10 when outputting the character pattern of the image buffer 22 with the X direction enlargement ratio=1 in the case of the normalized size of 30. The output of the ROM 28 also indicates the X address in the circumscribed rectangle, so the adder 32
It is added to Xmin and converted into an X address for actually addressing the image buffer 22. Here, the configuration of the normalized ROM matrix will be explained with reference to FIG. In this example, to simplify the explanation, the character frame dimensions are 10 x 10 bits (Figure 5A), and the normalized size is 4 x 4 bits (Figure 5A).
Normalized ROM matrix 18 for Figure B)
28 (FIG. 5C). Element Ekl of the kth row and lth column of the normalization matrix
The value of is determined by Ekl=INT(k×l/L+0.5). Here, L is the maximum value that the address index can take (3 in FIG. 5C), and INT(x) is the integer part of x. Row positions 0 to 9 are size indices corresponding to ΔX-1 or ΔY-1, and correspond to the upper addresses of the normalization matrix. Column positions 0 to 3 correspond to lower addresses of the normalization matrix. Generally, the number of rows in a matrix for normalization in the X direction is the number of bits in the X direction of the character frame (10 in the case of Figure 5), and the number of columns is the number of bits in the X direction of the normalized size (in the case of Figure 5). 4), the number of rows of the matrix for normalization in the Y direction is the number of bits in the Y direction of the character frame (10 in the case of Figure 5), and the number of columns is the number of bits in the Y direction of the normalized size. (4 in case of Figure 5)
Therefore, in the practical example shown in FIG. 4, the number of rows of the normalization matrices 18A, 28A is 80, the number of columns is 30, and the number of rows of the normalization matrices 18B, 28B is
80, and the number of columns is set to 60. In the case of Figure 5, the character frame and normalized size X,
Since the number of bits in the Y direction is the same, the normalization matrix shown in FIG. 5C can be used in common in the X and Y directions. In operation, for example, if the dimension in the X direction of the input character pattern Xmax-Xmin=ΔX-1 (size index) is 2, the value of the X normalization matrix is 0,
1, 1, 2 are read, so X address =
1 is generated twice and expanded. When the size index = 3, the dimension in the X direction of the circumscribed rectangle = the normalized size in the X direction, which corresponds to an enlargement ratio of 1. When the size index=9, X addresses=0, 3, 6, 9 are generated and thinning reading is performed. The Y-direction normalization matrix operates similarly. However, since the normalization matrix generates an address that converts the character pattern to the normalized size by setting the address of the upper left corner of the circumscribed rectangle as (0, 0), the actual X, Y address for accessing the image buffer 22 is Ax and Ay are given by the following equations. Ax = Xmin + matrix (ΔX-1, ix) Ay = Ymin + matrix (ΔY-1, iy) Here, matrix (ΔX-1, ix) and matrix (ΔY-1, iy) are ΔX-1 and ΔY-, respectively.
1 is the size index, ix, iy are the address
This is a matrix value obtained as an index. Adders 20 and 32 in FIG. 4 perform this addition. Therefore, the normalization buffer 5 of 64×64 bits
In the case of Fig. 4 using 2, normalization ROM18, 28
generates an address signal 4096 times (=64×64) and reads the image buffer 22. However, the third
In order to normalize the data and write it into the normalization buffer 52 as shown in the figure, some ingenuity is required. Comparator CMP4
2, 44 and adders 46, 48 are for that purpose. First, the principle will be explained with reference to FIG. Let the X and Y addresses Anx and Any of the normalization buffer 52 be given by the following equations. Anx=ixαx Any=iyαy Here, indicates addition of binary numbers (2 bits in FIG. 6, 6 bits in FIG. 4), ignoring overflow. Therefore, for example αx=0,
The data written as shown in Figure 6A when αy=0 is
When αx = 1 and αy = 2, data can be written by wrapping around starting points (1, 2) as shown in Figure 6B, and data to be written when ix > 1 and iy > 1 can be written. If masked, it will be written as shown in FIG. 6C. That is, the normalized buffer 5 with αx and αy
Specify the writing start point of 2, ix > limx, iy > limy
By masking the write data, the read output of the image buffer 22 can be masked and written to any position in the normalization buffer 52 with any size. The limit values limx and limy at this time are taken as limit count values. Adders 46, 48 and comparators 42, 44 control writing to normalization buffer 52 based on the above principle. Adders 46 and 48 receive addresses corresponding to the above iy and ix as one input from the address counter 30, and receive addresses corresponding to αy and αx as the other inputs from the multiplexer.
Receive from MPX38,40. The type selector 10 controls the MPXs 38 and 40 and selects the corresponding starting point address αx(2,
17, 23 or 27), αy (2, 17, 25, 32 or 47)
to adders 48 and 46. Adder 46 provides an upper address (H) for selecting the Y address of normalization buffer 52, and adder 48 provides a lower address (L) for selecting the X address. Therefore, the dot data read from the image buffer 22 is written from the starting point (αx, αy). Comparators 42, 44 receive as one input the addresses corresponding to iy, ix from address counter 30, and the limit count value from multiplexer MPX 34, 36 as the other input.
Type selector 10 gates the limit count value to MPX 34, 36 depending on the determined type. Comparators CMP42 and CMP44 operate AND gate 50 when iy and ix are less than the limit count value.
energized and exceeds the limit count value
AND gate 50 is prohibited. Note that the outputs of the type selector 10 are “2”, “17”, “23”, “25”,
“27”, “29”, “32”, “47”, “59”, “ΔX-1
”,
“ΔY−1” is MPX14, 26, 34, 36, 38, when these outputs are generated according to the type determination.
40 to select input of the corresponding number. Table 2 below is used for normalization of each type 1 to 10.
Indicates the ROM matrix (for normalized size 30...A, for normalized size 60...B), size index (X, Y), limit count value (X, Y), and starting point (X, Y). There is.

【表】 第3図に示したように、タイプ1、2、3、7
ではイメージ・バツフア22の文字パターンのX
方向の拡大比率を1にしてそのまま出力し、タイ
プ8、9ではY方向の拡大比率を1にしてそのま
ま出力する。したがつて、タイプ1、2、3、7
のXリミツト・カウント値はΔX−1、タイプ
8、9のリミツト・カウント値はΔY−1にされ
ている。また、拡大比率1はサイズ・インデツク
スが正規化マトリクスのアドレス・インデツクス
の最大値(正規化サイズ30では29、正規化サイズ
60では59)に等しい場合に得られるから、正規化
サイズ30を用いるタイプ1、2、3のXサイズ・
インデツクスは29、正規化サイズ60のタイプ7の
Xサイズ・インデツクスは59、正規化サイズ60の
タイプ8、9のYサイズ・インデツクスは59にさ
れている。そのため、タイプ・セレクタ10はタ
イプ1、2、3のときはマルチプレクサ26にお
いてサイズ・インデツクス29を選択しX方向拡
大比率1として正規化マトリクス28Aをアクセ
スし、タイプ7のときはマルチプレクサ26にお
いてサイズ・インデツクス59を選択しX方向拡
大比率1として正規化マトリクス28Bをアクセ
スし、またタイプ8、9のときはマルチプレクサ
14においてサイズ・インデツクス59を選択
し、Y方向拡大比率1として正規化マトリクス1
8Bをアクセスする。 以上の正規化機構によれば、アドレス・カウン
タが4096(=212)カウントする間に、イメージ・
バツフア22の1つの入力文字パターンがそのタ
イプに応じた大きさ及び位置をもつて正規化バツ
フア52に正規化して記憶されることになる。 また80×80ビツトの文字枠の場合正規化ROM
18,28の各X、Yアドレスは7ビツト・バイ
トで十分であるが、1ビツトを付加して8ビツ
ト・バイトとし、この1ビツトを出力ANDゲー
ト50の制御に使用すると、不用意な拡大を防止
することができる。即ち、例えばΔX=26、ΔY
=5、Gy重心=中部というような小さく横に細
長い文字パターンが入力された場合、この文字パ
ターンは表1に従いタイプ・セレクタ10におい
てタイプ5と判定される。従つてこの文字パター
ンは30×30ビツトに正規化され、その結果細長い
パターンが正方形に変形され、元の細長いパター
ンの形状上の特徴が失われることになる。このと
きのY方向の拡大率は6(=30/5)であるが、
正規化マトリクスの作成時に、正規化マトリクス
の同じ行に同じアドレスが所定数以上並ばないよ
うにし、残りの位置のアドレスには上記の付加1
ビツトによつて出力ANDゲートの禁止を指定し
ておけば、不用意な拡大を防止できる。 第7図は拡大率を最大2に抑えた正規化マトリ
クスの簡単な例を示している。第7図のAは拡大
率を抑えない場合であり、1ドツト幅の線(サイ
ズ・インデツクス=0)の場合は6倍に拡大さ
れ、2ドツト幅の線(サイズ・インデツクス=
1)の場合は3倍に拡大される。第7図のBは拡
大率を最大2に抑えた場合であり、出力ANDゲ
ート禁止ビツトHをセツトしたアドレスを両端に
配置し、このアドレスが正規化マトリクスから読
取られたとき出力ANDゲートを禁止するもので
ある。したがつて、サイズ・インデツクス=0、
1においても2倍の拡大に抑えられる。第4図に
おいて、出力ANDゲート50への線18H,2
8Hはこの出力ゲート禁止ビツトである。出力ゲ
ート禁止ビツトを有するアドレスを正規化マトリ
クスの両端に配置すれば、文字パターンを第3図
の正規化領域(斜線部分)の中心部に位置合わせ
して正規化できる。 なお、正規化段階で文字のタイプを特定する本
発明によれば、タイプ分エラーによる誤認識が1
つの問題となるが、予じめ記入者に大体の記入ガ
イドを与えておき、普通の注意力で記入してもら
つた実験結果によれば、十分実用しうることがわ
かつた。更に認識率を高める場合は、例えば
OCR帳票読取り用フオーマツト・プログラムに
おいてフイールド毎の文字種を規定し、小文字を
許さないフイールドではタイプ1〜6の選択を禁
止し、文字枠に小さめに書かれた大文字が小文字
サイズに正規化されて誤認識されるのを防止した
り、あるいは、タイプ分けエラーの生じやすい文
字パターンに対しては、類別される可能性のある
タイプでそれぞれ正規化したときの特徴を含むテ
ンプレート複数個用意しておくこともできよう。 正規化後、正規化バツフア52の文字パターン
は読出されて特徴抽出され、分類識別処理され
る。 [発明の効果] 本発明は入力文字パターンの大きさ、位置に基
いて文字パターンを複数のタイプに分け、入力文
字パターンをタイプ毎に異なる大きさ及び位置を
もつて正規化イメージ領域に正規化するから、正
規化イメージ領域内の文字パターンそのものが大
きさ、位置の情報を包含することになり、したが
つて以後の特徴抽出、分類識別の段階では入力文
字パターンの大きさ、位置を一切考慮する必要が
ないから、認識処理が簡単且つ高速になり、しか
も大文字と促拗音、小文字とを明確に区別でき
る。
[Table] As shown in Figure 3, types 1, 2, 3, 7
Now, the character pattern of image buffer 22 is X.
The enlargement ratio in the direction is set to 1 and the data is output as is.For types 8 and 9, the enlargement ratio in the Y direction is set to 1 and the data is output as is. Therefore, types 1, 2, 3, 7
The X limit count value of type 8 and type 9 is set to ΔX-1, and the limit count value of types 8 and 9 is set to ΔY-1. Also, when the expansion ratio is 1, the size index is the maximum value of the address index of the normalized matrix (29 for normalized size 30,
60 is equal to 59), so the X size of types 1, 2, and 3 using normalized size 30.
The index is 29, the X size index of type 7 with normalized size 60 is 59, and the Y size index of types 8 and 9 with normalized size 60 is 59. Therefore, for types 1, 2, and 3, the type selector 10 selects the size index 29 in the multiplexer 26 and accesses the normalization matrix 28A with an X-direction enlargement ratio of 1; The index 59 is selected and the normalization matrix 28B is accessed with the X-direction enlargement ratio of 1, and in the case of types 8 and 9, the size index 59 is selected in the multiplexer 14 and the normalization matrix 28B is accessed with the Y-direction enlargement ratio of 1.
Access 8B. According to the above normalization mechanism, while the address counter counts 4096 (=2 12 ), the image
One input character pattern in the buffer 22 is normalized and stored in the normalization buffer 52 with a size and position depending on its type. Also, in the case of a character frame of 80 x 80 bits, the normalization ROM
A 7-bit byte is sufficient for each of the X and Y addresses 18 and 28, but adding 1 bit to make an 8-bit byte and using this 1 bit to control the output AND gate 50 will result in unintentional expansion. can be prevented. That is, for example ΔX=26, ΔY
When a small, horizontally elongated character pattern such as =5, Gy center of gravity = middle part is input, this character pattern is determined to be type 5 by the type selector 10 according to Table 1. Therefore, this character pattern is normalized to 30 x 30 bits, resulting in the elongated pattern being transformed into a square and losing the geometric features of the original elongated pattern. At this time, the magnification ratio in the Y direction is 6 (=30/5),
When creating a normalization matrix, make sure that no more than a predetermined number of the same addresses are lined up in the same row of the normalization matrix, and add the above addition 1 to the addresses in the remaining positions.
By specifying inhibition of the output AND gate using a bit, careless expansion can be prevented. FIG. 7 shows a simple example of a normalization matrix with a maximum magnification of 2. A in Figure 7 shows the case where the magnification rate is not suppressed; a line with a width of 1 dot (size index = 0) is expanded six times, and a line with a width of 2 dots (size index = 0) is expanded six times.
In the case of 1), the image is expanded three times. B in Figure 7 shows the case where the magnification rate is suppressed to a maximum of 2, and an address with the output AND gate prohibition bit H set is placed at both ends, and when this address is read from the normalization matrix, the output AND gate is prohibited. It is something to do. Therefore, size index=0,
1, the expansion can be suppressed to 2 times. In FIG. 4, lines 18H, 2 to output AND gate 50
8H is this output gate inhibition bit. By arranging addresses having output gate inhibit bits at both ends of the normalization matrix, the character pattern can be normalized by aligning it with the center of the normalization area (shaded area) in FIG. According to the present invention, which specifies the character type at the normalization stage, the number of misrecognitions due to type errors is reduced to 1.
However, according to the results of an experiment in which a rough guide was given to the person filling out the form in advance and the person filled it out with normal attentiveness, it was found that it was sufficiently practical. If you want to further increase the recognition rate, for example
In the format program for reading OCR forms, the character type is specified for each field, and selection of types 1 to 6 is prohibited in fields that do not allow lowercase letters, and uppercase letters written smaller in the character frame are normalized to lowercase size and erroneously. To prevent character patterns from being recognized or to easily cause type classification errors, prepare multiple templates that include the characteristics when normalized for each type that may be classified. I can do it too. After normalization, the character patterns in the normalization buffer 52 are read out, features are extracted, and classification and identification processing is performed. [Effects of the Invention] The present invention divides the input character pattern into a plurality of types based on the size and position of the input character pattern, and normalizes the input character pattern into a normalized image area with a different size and position for each type. Therefore, the character pattern itself in the normalized image area includes size and position information, and therefore, the size and position of the input character pattern are not taken into account at all in the subsequent feature extraction and classification/identification stages. Since there is no need to do so, recognition processing becomes simple and fast, and uppercase letters, accents, and lowercase letters can be clearly distinguished.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明による正規化技術を用いた文字
認識方式の機能的ブロツク図、第2図は文字枠に
おける文字パターンの外接長方形を示す図、第3
図は、種々の正規化タイプを示す図、第4図は本
発明による正規化装置を示す図、第5図はイメー
ジ・バツフア、正規化イメージ・バツフア、及び
正規化ROMマトリクスを示す図、第6図は正規
化イメージ・バツフアの記憶パターンを示す図、
第7図は正規化ROMマトリクスの記憶パターン
を示す図である。
Fig. 1 is a functional block diagram of a character recognition method using the normalization technology according to the present invention, Fig. 2 is a diagram showing a circumscribed rectangle of a character pattern in a character frame, and Fig. 3 is a diagram showing a circumscribing rectangle of a character pattern in a character frame.
4 is a diagram showing a normalization device according to the present invention; FIG. 5 is a diagram showing an image buffer, a normalized image buffer, and a normalized ROM matrix; FIG. Figure 6 shows the storage pattern of the normalized image buffer.
FIG. 7 is a diagram showing a storage pattern of a normalized ROM matrix.

Claims (1)

【特許請求の範囲】 1 特殊文字、促音及び拗音文字を含む小形文
字、及び文字枠の中で大きな領域を占める大形文
字を含む認識対象文字パターンの2値化、切出さ
れた2値化文字パターンの正規化、正規化された
文字パターンについての特徴抽出、及び抽出され
た特徴に基づく分類識別によつて文字を認識する
文字認識方式において、 上記2値化文字パターンを大きさと文字枠内の
位置に基いて、所定の特殊文字のタイプ、促音及
び拗音文字を含む所定の小形文字のタイプ、及び
所定の大形文字のタイプを少なくとも含む複数の
タイプにタイプ分けする手段と、 上記2値化文字パターンを、上記タイプ毎に文
字パターン正規化領域の大きさ及び位置の少なく
とも一方を異ならせて一定の大きさの正規化イメ
ージ領域に正規化する手段とを備え、 上記正規化イメージ領域全体を対象として特徴
抽出するようにしたことを特徴とする文字認識方
式。
[Claims] 1. Binarization of a recognition target character pattern including special characters, small characters including consonants and consonant characters, and large characters occupying a large area in a character frame, and binarization of cut out characters. In a character recognition method that recognizes characters by normalizing character patterns, extracting features from the normalized character patterns, and classifying and identifying characters based on the extracted features, the above-mentioned binary character patterns are divided into sizes and character frames. means for classifying into a plurality of types based on the position of at least a predetermined special character type, a predetermined lower case type including consonant and consonant characters, and a predetermined upper case type; and means for normalizing the normalized character pattern into a normalized image area of a constant size by varying at least one of the size and position of the character pattern normalized area for each type, the entire normalized image area. A character recognition method characterized by extracting features from the target.
JP14872584A 1984-07-19 1984-07-19 Character recognition system Granted JPS6132187A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14872584A JPS6132187A (en) 1984-07-19 1984-07-19 Character recognition system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14872584A JPS6132187A (en) 1984-07-19 1984-07-19 Character recognition system

Publications (2)

Publication Number Publication Date
JPS6132187A JPS6132187A (en) 1986-02-14
JPH0516632B2 true JPH0516632B2 (en) 1993-03-04

Family

ID=15459211

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14872584A Granted JPS6132187A (en) 1984-07-19 1984-07-19 Character recognition system

Country Status (1)

Country Link
JP (1) JPS6132187A (en)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0776980B2 (en) * 1987-02-25 1995-08-16 沖電気工業株式会社 Character recognition method
JP2576984B2 (en) * 1987-03-20 1997-01-29 富士通株式会社 Character recognition processor
JPH0747329B2 (en) * 1987-09-28 1995-05-24 株式会社日立製作所 Document creation device
JPH01154296A (en) * 1987-12-10 1989-06-16 Fujitsu Ltd Character segmenting method
JPH01171080A (en) * 1987-12-25 1989-07-06 Matsushita Electric Ind Co Ltd Recognizing device for error automatically correcting character
JPH0747333B2 (en) * 1988-05-30 1995-05-24 財団法人工業技術研究院 Frame processing method
JPH07152864A (en) * 1991-08-07 1995-06-16 Hokkaido Prefecture Graphic generating system for hand-written alphanumeric character recognition
WO2019049187A1 (en) * 2017-09-05 2019-03-14 富士通株式会社 Program, information processing device, and information processing method

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5843071A (en) * 1981-09-08 1983-03-12 Toshiba Corp Character recognizing system
JPS58214973A (en) * 1982-06-09 1983-12-14 Hitachi Ltd Similar character discriminating system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5843071A (en) * 1981-09-08 1983-03-12 Toshiba Corp Character recognizing system
JPS58214973A (en) * 1982-06-09 1983-12-14 Hitachi Ltd Similar character discriminating system

Also Published As

Publication number Publication date
JPS6132187A (en) 1986-02-14

Similar Documents

Publication Publication Date Title
CA1160347A (en) Method for recognizing a machine encoded character
US5664027A (en) Methods and apparatus for inferring orientation of lines of text
US5373566A (en) Neural network-based diacritical marker recognition system and method
KR100658119B1 (en) Apparatus and Method for Recognizing Character
US5844991A (en) Script identification from images using cluster-based templates
JPH0727543B2 (en) Character recognition device
US5526440A (en) Hand-written character recognition apparatus
JPH0516632B2 (en)
JPH0430070B2 (en)
US7133556B1 (en) Character recognition device and method for detecting erroneously read characters, and computer readable medium to implement character recognition
JP2000090194A (en) Image processing method and image processor
JPH0247788B2 (en)
JP2788506B2 (en) Character recognition device
JPH08287188A (en) Character string recognition device
JP2938276B2 (en) Character recognition device
JP3072126B2 (en) Method and apparatus for identifying typeface
JP2906758B2 (en) Character reader
JPH08123904A (en) Character style classification processing device
JP2972443B2 (en) Character recognition device
JP2827288B2 (en) Character recognition device
JP2993533B2 (en) Information processing device and character recognition device
JP2804660B2 (en) Document processing device
JP2931485B2 (en) Character extraction device and method
JPS62290984A (en) Pattern information inputting paper and method of recognizing pattern information using said paper
JP2784004B2 (en) Character recognition device