JPS5945586A - Character recognizing device - Google Patents
Character recognizing deviceInfo
- Publication number
- JPS5945586A JPS5945586A JP57155631A JP15563182A JPS5945586A JP S5945586 A JPS5945586 A JP S5945586A JP 57155631 A JP57155631 A JP 57155631A JP 15563182 A JP15563182 A JP 15563182A JP S5945586 A JPS5945586 A JP S5945586A
- Authority
- JP
- Japan
- Prior art keywords
- character
- unknown
- processing
- character recognition
- detection means
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Abstract
Description
【発明の詳細な説明】
(イ)発明の分野
この発明は、カナ、英字、数字等の文字を自動的に読取
って認識する文字認鎗装((で1に関する。DETAILED DESCRIPTION OF THE INVENTION (A) Field of the Invention The present invention relates to a character recognition system ((1) for automatically reading and recognizing characters such as kana, alphabets, and numbers.
仲)発明の背景
近年1文字認識装置はコンピュータへの入力装置として
盛んに開発されてお九これら文字認識装置の多くは以下
に概説する順序に従って文字認識全行っている。BACKGROUND OF THE INVENTION In recent years, character recognition devices have been actively developed as input devices for computers.Most of these character recognition devices perform all character recognition in the order outlined below.
先ず、用紙に記録された文字を1文字7−、J:に光重
変換し、さらにrljJOJの2蹟パターンに変換する
。続いて、この2随パターンについて後処理を効果的に
行うために1JiJ処理を何う。即ち、用紙上の黒点な
どのノイズ処理や1文字図形境界而の平滑化などを含む
一連の処理を行う。次に2文字認識を行うのに必要な認
識ス]諌の未知文字の特徴(交点1分岐点、 /L/−
プ数1ストロークの長さ情報など)を抽出する特徴抽出
処理を行うことになる。この抽出結果に応じて多数の記
憶文字よシ特徴が共通する文字を候補文字として絞り込
む。First, a character recorded on a sheet of paper is subjected to optical weight conversion into one character 7-, J:, and further converted into a two-legged pattern of rljJOJ. Next, in order to effectively perform post-processing on this dichotomous pattern, 1JiJ processing is performed. That is, a series of processes including noise processing such as black dots on the paper and smoothing of single character/graphic boundaries are performed. Next, the recognition steps necessary to perform two-character recognition] Characteristics of the unknown character of 茌 (intersection 1 branch point, /L/-
A feature extraction process is performed to extract the number of strokes (length information of one stroke, etc.). Based on the extraction results, candidates are narrowed down to characters that have common characteristics among a large number of stored characters.
この絞シ込みによシ第1段階の認識を終了し、候補文字
が複数ある場合にはさらにその中から唯一の文字の選択
を行うための詳卸(な識別処理を行う。After this narrowing down, the first stage recognition is completed, and if there are a plurality of candidate characters, a detailed identification process is performed to select the only character from among them.
この詳細な識別処理は辞書照合処理といわれておυ、こ
の辞書とは各文字の特徴を一定の系列で格納したもので
9通常ROM′″′C構成されている。故に、上述の候
補文字の絞)込みは、辞書誘導処理と呼ばれ、特徴抽出
によって得られた特徴群に基づいて辞書の中から特定の
文字群を選定することになる。This detailed identification process is called dictionary matching process, and this dictionary stores the characteristics of each character in a fixed series, and is usually composed of 9 ROMs. This narrowing down is called dictionary guidance processing, in which a specific character group is selected from the dictionary based on the feature group obtained by feature extraction.
このように辞書誘導処理に続いて、辞書中に予め記憶さ
れた各文字の標準となる特徴系列(以下標錦パターンと
いう)と未知文字の特徴系列の一致度を検出する辞書照
合処理を行う。Following the dictionary guiding process in this manner, a dictionary matching process is performed to detect the degree of coincidence between the standard feature series of each character (hereinafter referred to as a "marker pattern") stored in advance in the dictionary and the feature series of the unknown character.
この照合結果に基づいて読取った文字を特定したり、あ
るいは認識不能として認識結果を出力するようになって
いる。Based on the matching results, the read character can be specified, or the recognition result can be output as unrecognizable.
この文字認識装置において、従来+ +iiJ記未知文
字を1文字毎に全ての文字につき例外なく、同一の辞書
誘導処理及び辞N)照合処理t!−rつでおシ。In this character recognition device, the conventional + +iiJ unknown characters are treated with the same dictionary guidance processing and dictionary matching processing for each character without exception. -r deshi.
つ1.ピリオドやコンマなどの(特殊文字も「ア」やr
AJなどの一般文字と合わせて同一の処理手順を経て処
理している。従って、パターン的に特徴を有する特殊文
字も1文字111に多数の−へ般文字同様の特徴抽出処
理を1]゛つた後、各文字群を選定するようにしている
。1. Periods, commas, and other special characters (including special characters like “a” and “r”)
It is processed through the same processing procedure as general characters such as AJ. Therefore, even for special characters having characteristics in terms of pattern, each character group is selected after a large number of feature extraction processes similar to those for general characters are performed on each character 111.
これでは、特殊文字において本来的に特徴チェックの必
要のないパラメータチェックも全て行うことになジ、そ
れだけむたfj:、処理」1“と費し認識列埋時間が長
くなシ、尚速処」星化を阻害するという問題があった。In this case, all parameter checks that do not originally require feature checking are performed for special characters, which wastes time for processing fj:, processing "1", which takes a long time to fill in the recognition queue. ” There was a problem that it hindered star formation.
(ハ)発明の目的
この発明は、かかる点に鑑み、特殊文字と一般文字とを
区別して認識することにより、認識処理時間を短かくシ
、高速処理化を図った文学誌gf’fk装置を提供する
ものである。(c) Purpose of the Invention In view of the above, the present invention provides a literary magazine gf'fk device which aims to shorten recognition processing time and speed up processing by distinguishing and recognizing special characters and general characters. This is what we provide.
に)発明の構成と効果
この発明は、上記目的を達成するために、未知文字パタ
ーンを読取る読取手段と、この読取った未知文字の未知
パターンの最外点を通って形成される外接四辺形の大き
さを予め設定された大きさと比較検出する範囲検出手段
と、前記読取手段の読取対象領域に対する読取った未知
パターンの位置を検出する位置検出手段と、前記未知パ
ターンを一方向に定量して未知文字のセパレートを検出
する離隔検出手段と、@記外接四辺形の長さ′ff:検
出する長さ検出手段と、ピリオド、コンマ、バーなどの
特殊文字のみの認識処理手順を記憶し、特殊文字認識処
理を遂行する手段と、一般文字認識処理手順を記憶し、
一般文字認識処理を遂行する手段と、前記範囲検出手段
9位置検出手段、離隔検出手段及び長さ検出手段の検出
出力の1組合せに応じてr2TI記特殊文字認識処理遂
行手段あるいはMiJ記一般文字認識処3!l!遂行手
段を選択動作させる手段とを備え、特殊文字を一般文字
と区分して認識するように構成されている。B) Structure and effect of the invention In order to achieve the above object, the present invention provides a reading means for reading an unknown character pattern, and a reading means for reading an unknown character pattern, and a reading means for reading a circumscribed quadrilateral formed through the outermost point of the unknown pattern of the read unknown character. range detection means for detecting the size by comparing it with a preset size; position detection means for detecting the position of the read unknown pattern relative to the reading target area of the reading means; A separation detection means for detecting separation of characters, a length detection means for detecting the length of the circumscribed quadrilateral 'ff: @, and a recognition processing procedure for only special characters such as periods, commas, and bars are memorized, and special characters are stored. Memorize means for performing recognition processing and general character recognition processing procedures;
Depending on one combination of the means for performing general character recognition processing and the detection outputs of the range detection means 9 position detection means, distance detection means, and length detection means, the special character recognition processing means specified in r2TI or the general character recognition specified in MiJ is performed. Place 3! l! and means for selectively operating the execution means, and is configured to recognize special characters separately from general characters.
したがって、この発明によれば、特殊文字1−股文字と
比較することなく選別し、!1.〒殊文字を別個に認識
するようにしているので9文字認識の処理速度を高める
ことができる。Therefore, according to the present invention, the special characters 1--are selected without comparing with the crotch characters, and! 1. Since the special characters are recognized separately, the processing speed of nine character recognition can be increased.
(ホ)実施例の説明
第1図はこの発明の文字認識装j1″り1′1の回路ブ
ロック図を示し、用紙Pに記録された文字2は九′ぼ変
換回路ろにより光学パターンとして読取られ。(E) Description of the Embodiment FIG. 1 shows a circuit block diagram of the character recognition device 1'1 of the present invention, in which the character 2 recorded on the paper P is read as an optical pattern by the 9' conversion circuit. Rare.
この光電変換11」路乙に連繋されたA/’D父換回路
4によシデシタルテ゛−夕に変1戻される(1;7aJ
t父手段)。The photoelectric conversion circuit 4 connected to the photoelectric conversion circuit 11 converts the digital data back to 1 (1; 7aJ
t father means).
とのA / Dノ換回路4は第lRAM5(画像メモリ
)に連繋され、且つ光′屯変換回1烙5と共にCPU6
に連繋されている。このCPU6は第lRAM5及び第
2RAM7(ワークメモリ)とROM8,9.10,1
1.12とにそれぞれ連繋されている。The A/D conversion circuit 4 is connected to the first RAM 5 (image memory), and together with the optical conversion circuit 15, the CPU 6
is connected to. This CPU 6 has a first RAM 5, a second RAM 7 (work memory), and ROMs 8, 9, 10, 1.
1.12, respectively.
第lRAM5&−i第2図に示すように、A/D変換回
路4から出力される光学パターン全格納するもので、光
学パターンの読取ヌ・1象領峡13を縦横方向のX方向
とY方向とにそれぞれ32ビットに区分し、2次元で認
識対象の未知文字2の文字バターンを格納するようにな
っている。As shown in FIG. The character pattern of the unknown character 2 to be recognized is stored two-dimensionally.
この第1 RAM5に格納される未知文字の文字パター
ン2aよシ1文字パターンの最左側のX座標Xsと、最
右側のX座標XE、および最上側のY座標Ysと最下側
のY座標YEが抽出されそれぞれ第2RA’M7に格納
されるように1′+4成されてお9.これらの座標Xs
、XE及びYs、Y+gより第6図に示すように、未知
文字パターン2aの最外点を通る外接四辺形14(大き
さXw 、 YII)が算出される。The leftmost X coordinate Xs, the rightmost X coordinate XE, the topmost Y coordinate Ys, and the bottommost Y coordinate YE of the character pattern 2a of the unknown character stored in the first RAM 5. are extracted and stored in the second RA'M7, respectively.9. These coordinates Xs
, XE, Ys, and Y+g, as shown in FIG. 6, a circumscribed quadrilateral 14 (sizes Xw, YII) passing through the outermost point of the unknown character pattern 2a is calculated.
また、第1 ROM8はCPU6の動作プログラムが格
納されてお、jp、%2ROM9は、ピリオド「・」、
コンマ「、」、濁点「”」、半濁点「0」。In addition, the first ROM 8 stores the operating program of the CPU 6, and the jp, %2 ROM 9 has a period "・",
Comma ``,'', voiced mark ``'', half-voiced mark ``0''.
バー「1」などの特殊文字を検出する基準須X1゜X3
.Yl 、Y2.Y3が格納されている。この基準(l
fX ”1. Y 1は第4図に示すように、未知パタ
ーン2aの大きさを検出するために設定された読取対象
領域13内における基準範囲(位置Cよ問題とされない
)15のX方向値とY方向値であり。Criteria for detecting special characters such as bar “1” X1゜X3
.. Yl, Y2. Y3 is stored. This standard (l
fX "1. Y 1 is the X-direction value of the reference range (position C does not matter) 15 within the reading target area 13 set to detect the size of the unknown pattern 2a, as shown in FIG. is the Y direction value.
この基準fmX1.Y1と外接四辺形14のXw。This standard fmX1. Y1 and Xw of circumscribed quadrilateral 14.
Y Hとを比中交することになる。、j、j、(Ill
二有+’zY2は第5図に示すように、読取対象領域1
3に対する未知パターン2aの位置全検出するために設
シゼされ7た値であり、読取対象領域13全上下に2分
割して。This will lead to exchange between China and YH. ,j,j,(Ill
2+'zY2 is the reading target area 1 as shown in FIG.
This is a value set to detect the entire position of the unknown pattern 2a relative to 3, and the entire reading target area 13 is divided into upper and lower halves.
外接四辺形14が上部あるいは上部又は−1八丁に亘っ
ているか否かを検出することになる。占(?i、!4値
X口。It is detected whether the circumscribed quadrilateral 14 extends over the upper part, the upper part, or -1 octave. Fortune telling (?i, !4 value X mouth.
¥3は第6図に示すように、外j′ど四辺形14のX方
向の長さ、つまシ誌、ii′il!対象文字2の広がシ
を検出するために設定された基桑範囲16のX方向値と
Y方向値であシ、この基?−m[直X3.Yろと外接四
辺形14のXw、YIIとを比Φりすることになる。¥3 is the length of the outer j' quadrilateral 14 in the X direction, as shown in Fig. 6, and the length of the square, ii'il! This base? -m[DirectX3. This means that Y lo and Xw and YII of the circumscribed quadrilateral 14 are compared.
まメこ+ff1iJi己第1 ROM8は、第7図に示
すa完月又対象頑域13をX方向に走査しつつ走査竪を
Y方向に移動する2次元走査の動作プログラムを他の動
作プログラムとともに格納しており、この走査によシ未
知文字2のス1〜ロークの上下間のセパl/−トを検出
するようになっている。この場合、第8図(a)、 (
1))、 (0)に示す文子パターン例ケ考えると第8
図(a)はセパレートが無く、第8図(b)iはセパレ
ートが有シ、第8図(c)は2つの部分よりなるものの
、上部の左端と下部の右端とがX方向において重なシ合
うのでセパレートが無いことになる。Mameko + ff1iJi 1st ROM 8 contains, along with other operation programs, a two-dimensional scanning operation program that scans the complete moon or target area 13 in the X direction and moves the scanning vertical direction in the Y direction, as shown in Fig. 7. By this scanning, the separation between the upper and lower strokes of the unknown character 2 is detected. In this case, Fig. 8(a), (
1)), Considering the Bunko pattern example shown in (0), the 8th
Figure (a) has no separate part, Figure 8 (b) i has a separate part, and Figure 8 (c) has two parts, but the left end of the upper part and the right end of the lower part overlap in the X direction. Since they fit together, there are no separates.
Ig3ROM10は1分類テーブルメモリであシ。Ig3ROM10 is 1 classification table memory.
第9図の右欄に示すように、エラーコードや各種処理ル
ーチンのアドレスを記・臆している。そして第9図の左
欄に示すように、外]χ四辺形の大きさ。As shown in the right column of FIG. 9, error codes and addresses of various processing routines are written down. And, as shown in the left column of Figure 9, the size of the χ quadrilateral.
長さ1位置、及びセパレートの有無によって定寸るコー
ド化信号が第2 RA M (ワークメモリ)7よす加
えられる。そのコード化信号に対応したアドレスが指定
され、その指定されたアドレスに記′1、ホされるエラ
コード、リジェクトコードもしくは処理ルーチンアト−
レヌが出力されるようになっている。たとえば第2RA
M7よシのコード化信号が00101100であるとア
ドレス44が指定され tt + 1”辞書処理ルーチ
ンアドレスが出力されることになる。A coded signal that is sized according to the length position and the presence or absence of separation is added to a second RAM (work memory) 7. An address corresponding to the coded signal is specified, and an error code, reject code, or processing routine address is written in the specified address.
Renu is now output. For example, 2nd RA
If the coded signal from M7 is 00101100, address 44 will be specified and the dictionary processing routine address tt+1'' will be output.
第2RAM7は、第10図及び第11図に示すように、
未知文字パターンの抽出された外接四辺形14のXS、
XE、YS、YEや大きさく7)r−ド化結果などが格
納されるようになっており、0がら7までのアドレスを
持つ谷ワード記゛1.ばエリアを備え、1ワードは32
ビツトでイj<現するようになっている。アドレス0に
は外jγ、四辺形14のXs。The second RAM 7, as shown in FIGS. 10 and 11,
XS of the circumscribed quadrilateral 14 from which the unknown character pattern was extracted,
XE, YS, YE, size 7) r-code conversion results, etc. are stored, and it is a valley word record with addresses from 0 to 7. 1 word has 32
It has come to appear in bits. At address 0, outside jγ, Xs of quadrilateral 14.
アドレス1にはXILアトレスンにはYs、ア1ルヌ3
にはYノ艶、アドレス4Kll−1,X))、アトルヌ
5にはYHがそれぞれ格納されておシ、X〜v、Yoは
次式で算出される。Address 1 is XIL Atreson is Ys, A1 Runu 3
, address 4Kll-1, X)) and address 4Kll-1,
X w = X +ルー(XE−1)
Y u = Y 1< −(Y s −
1)さらに、アトレヌ6にはセパレートの%J、1jj
F、を1′11足するためのX方向論理和1直が格納さ
れ、アドレス7においてはピッ1−24からピッ1−2
6て外接四辺形14の上、中、下の位:1コ邑 ピッ1
−27でセパレートの有無、ビット28からビットろ1
で91・接四辺形14の大きさ及び長さ(Y11≦Y3
.Y。X w = X + Lu (XE-1) Y u = Y 1< -(Y s -
1) Furthermore, Atrenu 6 has separate %J, 1jj
The X-direction OR 1-direction for adding 1'11 to F is stored, and at address 7, the bits 1-24 to 1-2 are
6. Upper, middle, and lower digits of circumscribed quadrilateral 14: 1 piece Pi 1
-27 indicates presence or absence of separate, bit 28 to bit 1
91・Size and length of tangent quadrilateral 14 (Y11≦Y3
.. Y.
≦Y1.Xw≦X 3 + X w≦X1)がセラ1−
されるようになっている。≦Y1. Xw≦X3+Xw≦X1) is Sera 1-
It is now possible to do so.
尚、第4ROM11は一般文字の文!t′照合等の認識
処理ルーチンが、第5ROM12tri特殊文字の文字
照合等の認識処理ルーチンが格納されておシ、これらの
Rotll 、12に格納される一般文字認識処理ルー
チンや特殊文字認識処理ルーチンはROM10よりのア
ドレス信号を受けて選択動作するようになっている。In addition, the 4th ROM11 is a sentence of general characters! The recognition processing routines such as character matching of special characters are stored in the 5th ROM 12, and the general character recognition processing routines and special character recognition processing routines stored in these Rotll. The selection operation is performed in response to an address signal from the ROM 10.
次に1文字認識動作について説明する。Next, a single character recognition operation will be explained.
先ス、第1 ROM8のプログラムに従っテCPU6が
動作し、このCPU6の制御によシ用紙Pの文字2が光
電変換回路6で電気信号に変換され、続いてA / D
変換回路4でデシメ/I/f=号に変換され、読取対象
領域16を黒地は1.白地はOで表現し第lRAM5に
1文字パターンを格納する(第2図参照)。First, the CPU 6 operates according to the program in the first ROM 8, and under the control of this CPU 6, the character 2 on the paper P is converted into an electrical signal by the photoelectric conversion circuit 6, and then the A/D
The conversion circuit 4 converts the decimal/I/f= number, and the black background of the reading target area 16 becomes 1. A white background is represented by O, and one character pattern is stored in the first RAM 5 (see FIG. 2).
この第lRAM5における未知文字2の未知パターン2
aに基づいて一般文字か特殊文字かが識別される。この
識別動作を第12図に示す制御フローに従って説明する
。尚、第2ROM9に格納される基準碩X1.X5.y
i、Y2.Y3は下記の通シ設定されているものとする
。Unknown pattern 2 of unknown character 2 in this first RAM 5
Based on a, a general character or a special character is identified. This identification operation will be explained according to the control flow shown in FIG. Note that the reference size X1.x stored in the second ROM9. X5. y
i, Y2. It is assumed that Y3 is set as follows.
X1=9. X3=7゜
Yi=9. Y2=16. Y3=7゜先ず、ステ
ップ211/Cおいて、 ′!;IG+ RAIVI5
の未知パターン2aにおけるXY方向の最クー・点を通
る外接四辺形14の座信1がJ1測される。即ち、第1
RAM5の座、隙のY値を昇順に変化しく (D、0
)。X1=9. X3=7°Yi=9. Y2=16. Y3=7° First, at step 211/C, '! ;IG+ RAIVI5
The locus 1 of the circumscribed quadrilateral 14 passing through the most Ku point in the XY direction in the unknown pattern 2a is measured J1. That is, the first
Change the Y values of the seats and gaps in RAM5 in ascending order (D, 0
).
(0,1) 、(0,2)、・・・・・・(0,31)
、(1,0)、(1,1) 、・・・・・)と走査し、
黒白(1/10)全判別し、最初に黒(1)であったピ
ッ)−のX座(票をXsとし1次に1−1f己のY敏を
降順に変化しく (51,31) +(51、ろO)、
(31,29)、 ・・・・・・・・ (ろ1 .
0)、(30,31) 、(ろ0 .30)。(0,1), (0,2),...(0,31)
, (1,0), (1,1),...),
Black and white (1/10) all discriminated, and the first black (1) Pi) -'s + (51, RoO),
(31,29), ...... (Ro1.
0), (30,31), (ro0.30).
・・・・・・・)と走査し、黒白(1/)i判定し、最
初に黒(1)であつ7にビットのX座標’fcX I・
:とする。......), and determines black and white (1/)i, and first it is black (1) and at 7, the X coordinate of the bit 'fcX I・
: To be.
さらに、座標のう【値をケイ順にザーヒしく (0,0
) 。Furthermore, the values of the coordinates are sorted in order (0, 0
).
(1,0) 、(2,0) ・・・ ・・ (ろ1
、O)、(0,1)、(1,1) 、 ・ 山
)と走査し、さらに丑た降順に父化しく (31,3
1)。(1,0) , (2,0) ... ... (ro1
, O), (0,1), (1,1), ・mountain), and then in descending order of ox (31,3
1).
(30,51)、(29,31)、 ・・・・・・・
・・(0,31)、(31,30ン 。(30,51), (29,31), ...
...(0,31), (31,30n.
(3030)、・・・・・・・・・)と走査し、最初に
黒(1)でめったビットのY座標をそれぞれYs、YI
>とする。このXs、X1弓、YS、Yl(が外接四辺
形14の座標であり、第2RAM7のアドレスD〜ろに
それぞれ格納される。(3030), ......), and the Y coordinates of the first black (1) bit are Ys and YI, respectively.
>. These Xs, X1 bow, YS, and Yl (are the coordinates of the circumscribed quadrilateral 14, and are stored in addresses D to D of the second RAM 7, respectively.
続いて、ステップ22において、上記Xs、X1g。Subsequently, in step 22, the above Xs and X1g.
Ys、Yx+よシ外接四辺形14(未知パターン2a)
の幅Xwと高さY Hとが算出され、第2RAM7のア
ドレス4.5に格納される。Ys, Yx+Yoshi circumscribed quadrilateral 14 (unknown pattern 2a)
The width Xw and height YH of are calculated and stored at address 4.5 of the second RAM 7.
引キ続いて、ステップ23において、外接四辺形14の
大きさ及び長さが比較され、つまり、 XwとY IT
が第2ROM9に格納された基準範囲15゜16のxl
、yl及び)l、Y5よシ大きいが否かが比較され、Y
H≦Y6.YI(≦Y1.Xw≦X1.Xw≦X3がそ
れぞれ成立すると、第2RAM7のアトレア7のビット
28〜31に1がセットされ、成立しないとDとされる
。Subsequently, in step 23, the size and length of the circumscribed quadrilateral 14 are compared, i.e., Xw and Y IT
xl with a reference range of 15°16 stored in the second ROM 9
, yl and )l are compared to see if they are larger than Y5, and Y
H≦Y6. If YI (≦Y1.
次に、ステップ24において、未知パターン2aの読取
′A象領領域ろに苅する位置が検出され、つまり、第2
RAM7のアドレス2.3に格納されたYs、YEと第
2ROM9に格納サレタY 2 、、!:が比較され、
Y E < (32−Y2)のときは未知パターン2
aが上半部に位置することになシ第2RAM7のアドレ
ス7のビット24に1がセットされ。Next, in step 24, the position where the unknown pattern 2a is read in the A quadrant area is detected, that is, the second
Ys and YE stored at address 2.3 of RAM 7 and Y 2 stored in second ROM 9,...! : is compared,
When Y E < (32-Y2), unknown pattern 2
Since a is located in the upper half, bit 24 of address 7 of the second RAM 7 is set to 1.
Ys≧(32−Y2)のときは未知パターン2aが下半
部に位置することに々リヒノ1〜26に1かセットされ
、上記以外のときは末9′:11パターン211か上下
に亘って位置することになり、ヒツト25に1がセット
されることになる。When Ys≧(32-Y2), the unknown pattern 2a is located in the lower half, and 1 is set in Rihino 1 to 26, and in other cases, the unknown pattern 2a is located in the lower half, and in other cases, the last 9':11 pattern 211 or the upper and lower parts are set. Therefore, 1 is set in hit 25.
そして、ステソゲ25において、未知パターン2aのセ
パンートか(欠出される。つまり、第lRAM5の読取
対象領域15において、Y座標(O〜61)のそれぞれ
についてX座標の論理′Allを行い。Then, in the stem drive 25, the unknown pattern 2a's sepantate (is omitted). That is, in the reading target area 15 of the first RAM 5, the logic 'All' of the X coordinate is performed for each of the Y coordinates (0 to 61).
その結果f第2 RAM 7のアドレス6の各ヒツトに
格納し、この各ビット笛チェックして1−0−1となれ
は上下にセパレートシていることになり。As a result, it is stored in each address 6 of the f-th RAM 7, and each bit whistle is checked to see that if they are 1-0-1, they are separated vertically.
i21(AM7のアドレス7のビット27に1tセット
することになり、未知文字2の特徴が抽出される。i21 (bit 27 of address 7 of AM7 is set to 1t, and the characteristics of unknown character 2 are extracted.
最後に、ステップ26において+ 第21Z A+VI
7の、アドレス7にコード化され/こコード化11〆1
に基つき、第3goMtoに格納されたエラーコートや
りジエクトコード、各種処理ルーチンのアドレスを指定
し、それぞれ対応する処理ルーチンの処理動作が遂行さ
れることになる。即ち、エラーコードの場合はコード化
値が論理的に存在1〜ないことになり、リジェクトコー
ドの場合は読取対象外ということになる。Finally, in step 26 + 21st Z A+VI
7, coded at address 7 / coded 11〆1
Based on this, the error code, address code, and addresses of various processing routines stored in the third goMto are specified, and the processing operations of the corresponding processing routines are executed. That is, in the case of an error code, the coded value is logically 1 to not present, and in the case of a reject code, it is not to be read.
まだ、特殊文字の場合はコード化されだ1ぎ号に対応し
た特殊文字処理ルーチン(例えば、第9図に示すアドレ
ス44.83)のアドレスが選択され、このアドレスに
より予め設定された。15 a。In the case of a special character, the address of the special character processing routine corresponding to the encoded number (for example, address 44.83 shown in FIG. 9) is selected and preset with this address. 15 a.
1辺12の特殊文字処理手順に基づき1文字の特徴系列
を抽出し、設定された探索方法に従って辞書誘導処理、
辞書照合処理等が行なわれ1文字2が認識される。A feature sequence of one character is extracted based on the special character processing procedure of 12 characters per side, and dictionary guidance processing is performed according to the set search method.
Dictionary checking processing and the like are performed and one character 2 is recognized.
一方、一般文字については、一般文字処理ルーチンのア
ドレス(例えば、第9図に示すアドレス64)が指定さ
れ、予め設定された第4ROM11の一般文字処理手順
に基づき1文字の4H!系列を抽出し、設定された探累
方法に従って、辞書誘導処理及び辞書照合処理等を行い
8文字を認識する。On the other hand, for general characters, the address of the general character processing routine (for example, address 64 shown in FIG. 9) is specified, and the 4H! The sequence is extracted, and according to the set search method, dictionary guidance processing, dictionary matching processing, etc. are performed to recognize eight characters.
次に、具体的な認識対象文字2について第13図乃至第
15図に基づき、一般文字と特殊文字の識別動作につい
て説明する−
第16図における未知文字2に1、第11I A M
5においてパターン化され、未知パターン2・tより外
接四辺形14が1画され、その高さ及U・幅が規出され
る。算出された各位は
X5=5.X+シ ニー 3 0 +Ys =20.
Yll; =22 。Next, the discrimination operation between general characters and special characters will be explained for specific recognition target character 2 based on FIGS. 13 to 15.
5, a circumscribed quadrilateral 14 is drawn from the unknown pattern 2.t, and its height, U, and width are determined. The calculated value for each person is X5=5. X+Shiny 3 0 +Ys =20.
Yll; =22.
Xw=26. Yo=3 。 となる。Xw=26. Yo=3 . It becomes.
これらをxi =9.X’3=7.Y 1−9.Y2=
16.¥3−7と比■咬し、かつ第2RAM7のアドレ
ス6のX方向論理和を行うと、第2RAM7のアドレス
7のコード化値が44となり、第ろRolVIiQの「
−」辞岩処1シ11ルーチンか顆択される。These are xi =9. X'3=7. Y 1-9. Y2=
16. When compared with ¥3-7 and performing the X-direction logical sum of the address 6 of the second RAM 7, the coded value of the address 7 of the second RAM 7 becomes 44, and the
-"Jiwadokoro 1shi11 routine is selected.
第14図においてはセパレートが検出され、他の外接四
辺形14の1測等は同様に行なわれ、第2RAM7のア
ドレス7のコード化値か335となり、第3ROM10
の「;」辞ノ1処理ルーチンが選択される。In FIG. 14, a separate is detected, and the other circumscribed quadrilaterals 14 are measured in the same way, and the encoded value of address 7 of the second RAM 7 becomes 335, and the coded value of the third ROM 10 becomes 335.
The ";" dictionary no. 1 processing routine is selected.
第15図においては第2RA、IV’I7のアドレス7
のコード化値が60となり、第3ROM400一般文字
処理ルーチンが選択される。In FIG. 15, address 7 of 2nd RA, IV'I7
The encoded value becomes 60, and the third ROM 400 general character processing routine is selected.
尚、未知パターン2aの大きさを検出する範囲検出手段
は、実施例のようにXl、Y’lに対して長さを比較す
る外1面積を求めて比較してもよい。Note that the range detecting means for detecting the size of the unknown pattern 2a may calculate and compare one area in addition to comparing the lengths of Xl and Y'l as in the embodiment.
まだ、未知パターン2aの長さ検出手段は、実施例のよ
うにX3.’Y3に対して長さを比較する外1幅(Xw
)と高さく YH)の比率を求めて基準値と比較する
ようにしてもよい。Still, the length detecting means of the unknown pattern 2a is X3. 'Outer 1 width (Xw
) and the height (YH) may be calculated and compared with the reference value.
また、未知パターン2aの位置換呂手段は、実施例のよ
うに¥2のみ基準値とする必要はなく。Furthermore, it is not necessary to set only ¥2 as the reference value for the position changer of the unknown pattern 2a as in the embodiment.
X方向も含めた多種類の基準値を設定してもよい。Many types of reference values including the X direction may be set.
図面はこの発明の一実施例を示し、第1図は文字認識装
置の回路ブロック図、第2図は第lRAMに格納される
未知パターンの説明図、第6図は外接四辺形を示す未知
パターンの説明図、第4図は未知パターンの大きさを比
較する基準値X1゜Ylの説明図、第5図は未知パター
ンの位置を検出する基準値Y2の説明図、第6図は未知
パターンの長さを比較する基準値X3.¥3の説明図。
第7図はセパレー1−を検出する走厩動作の説明図。
第8図(a)、 (b)、 (0)はセパレーI−の険
出態1.)。の説明図、第9図は第3 ROIAに格納
された1杷・1.は内容の説明図、第10図は第2RA
114に格納された記憶内容の説明図、第11図は第2
RA fvIのアドレス7に格納された記・隠内容の
説明図、第12図は文字認識装置の制1II41動作の
一部を説明する制御フロー図、第13図乃至第・15・
図は44体的文字について識別態様を示し、第16図(
a、) 、第14図(a、)及び第15図(alは第l
RAMの未知パターンの説明図、第13図(b)、第1
4図(1))及び第15図(1))は第2RAIVIの
記憶内容の説明図である。
1:文字認識装置、 2:文字、 3:光電変換回路、
4:A/D父換凹b!り+ 5・7:RAM、
6:CPU、 (3・9・10・11・12 :R
Old、 13 :r’扉収苅象1偵域。
14:外接四辺形、 15・16:−1A準0(12
囲。
2a:未知パターン。
特許出願人 立石′成機株式会社代理人 弁
理士 中 村 茂 イd第1図
1
第2図
X 第3図第6
N 第γ図第14図
ノα
第15図
(α)
X→−
Cb)
ビット
(b)
ビットThe drawings show an embodiment of the present invention; FIG. 1 is a circuit block diagram of a character recognition device, FIG. 2 is an explanatory diagram of an unknown pattern stored in the first RAM, and FIG. 6 is an unknown pattern showing a circumscribed quadrilateral. 4 is an explanatory diagram of the reference value X1°Yl for comparing the size of unknown patterns, FIG. 5 is an explanatory diagram of reference value Y2 for detecting the position of unknown patterns, and Reference value for length comparison X3. Explanatory diagram of ¥3. FIG. 7 is an explanatory diagram of the running operation for detecting the separator 1-. Figures 8(a), (b), and (0) show the sudden appearance 1 of Separate I-. ). 9 is an explanatory diagram of 1 loquat and 1. stored in the 3rd ROIA. is an explanatory diagram of the contents, Figure 10 is the 2nd RA
114 is an explanatory diagram of the memory contents stored in the second
12 is a control flow diagram explaining part of the operation of the control 1II41 of the character recognition device, and FIGS.
The figure shows the identification mode for 44 characters, and Figure 16 (
a,), Fig. 14 (a,) and Fig. 15 (al is the lth
Explanatory diagram of unknown pattern of RAM, Fig. 13(b), 1st
FIG. 4 (1)) and FIG. 15 (1)) are explanatory diagrams of the storage contents of the second RAIVI. 1: Character recognition device, 2: Characters, 3: Photoelectric conversion circuit,
4: A/D father replacement b! ri+5・7: RAM,
6: CPU, (3, 9, 10, 11, 12: R
Old, 13: r' door collection elephant 1 reconnaissance area. 14: Circumscribed quadrilateral, 15・16: -1A quasi 0 (12
Enclosed. 2a: Unknown pattern. Patent Applicant Tateishi Seiki Co., Ltd. Agent Patent Attorney Shigeru Nakamura ID Figure 1 1 Figure 2 X Figure 3 Figure 6
N Fig. 14-α Fig. 15 (α) X→- Cb) Bit (b) Bit
Claims (1)
った未知文字の未知パターンの最外点を通って形成され
る外接四辺形の大きさを予め設定された大きさと比較検
出する範囲検出手段と。 前記読取手段の読取対象領域に対する読取った未知パタ
ーンの位置を検出する位置検出手段と。 前記未知パターンを一方向に走査して未知文字のセパレ
ートを検出する離隔検出手段と、前記外接四辺形の長さ
を検出する長さ検出手段と。 ピリオド、コンマ、バーなどの特殊文字のみの認識処理
手順を記憶し9特殊文字認識処理を遂行する手段と、一
般文字認識処理手順を記憶し。 一般文字認識処理を遂行する手段と、前記範囲検出手段
1位置検出手段、離隔検出手段及び長さ検出手段の検出
出力の組合せに応じてI8U記特殊文字認識処理遂行手
段あるいは前記一般文字認識処理遂行手段を選択勅1′
1させる下段とを備え、特殊文字を一般文字と区分して
認識することを特徴とする文字認識装置ハ1°。(1) A reading means for reading an unknown character pattern, and a range detection means for comparing and detecting the size of a circumscribed quadrilateral formed through the outermost point of the unknown pattern of the read unknown character with a preset size. . position detection means for detecting the position of the read unknown pattern relative to the reading target area of the reading means; separation detection means for detecting separation of unknown characters by scanning the unknown pattern in one direction; and length detection means for detecting the length of the circumscribed quadrilateral. 9. Means for storing recognition processing procedures for only special characters such as periods, commas, and bars, and performing special character recognition processing, and storing processing procedures for general character recognition. Depending on the combination of the means for performing general character recognition processing and the detection outputs of the range detection means 1 position detection means, distance detection means and length detection means, the special character recognition processing means described in I8U or the general character recognition processing is performed. Choosing the means 1'
1. A character recognition device C1° characterized in that the character recognition device C1 is equipped with a lower stage that recognizes special characters separately from general characters.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57155631A JPS5945586A (en) | 1982-09-06 | 1982-09-06 | Character recognizing device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57155631A JPS5945586A (en) | 1982-09-06 | 1982-09-06 | Character recognizing device |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS5945586A true JPS5945586A (en) | 1984-03-14 |
Family
ID=15610205
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57155631A Pending JPS5945586A (en) | 1982-09-06 | 1982-09-06 | Character recognizing device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS5945586A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4662479A (en) * | 1985-01-22 | 1987-05-05 | Mitsubishi Denki Kabushiki Kaisha | Operating apparatus for elevator |
JPH01277986A (en) * | 1988-04-30 | 1989-11-08 | Sony Corp | Character recognizing device |
-
1982
- 1982-09-06 JP JP57155631A patent/JPS5945586A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4662479A (en) * | 1985-01-22 | 1987-05-05 | Mitsubishi Denki Kabushiki Kaisha | Operating apparatus for elevator |
JPH01277986A (en) * | 1988-04-30 | 1989-11-08 | Sony Corp | Character recognizing device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Mahmoud | Arabic character recognition using Fourier descriptors and character contour encoding | |
US5734750A (en) | Character recognition method and apparatus | |
EP0325233B1 (en) | Character string recognition system | |
EP0114250B1 (en) | Confusion grouping of strokes in pattern recognition method and system | |
US3755780A (en) | Method for recognizing characters | |
JPH0562391B2 (en) | ||
CA2224540A1 (en) | Method and apparatus for on-line handwritten input character recognition and recording medium for executing the method | |
US4524453A (en) | Postal code distinguishing apparatus | |
JPS5945586A (en) | Character recognizing device | |
JPS592191A (en) | Recognizing and processing system of handwritten japanese sentence | |
JPS62271086A (en) | Pattern recognizing device | |
JP2578767B2 (en) | Image processing method | |
JP2851865B2 (en) | Character recognition device | |
KR900005141B1 (en) | Handwritter character recognizing device | |
CA2057412C (en) | Character recognition system | |
JP2953162B2 (en) | Character recognition device | |
JPH0436435B2 (en) | ||
JP2875678B2 (en) | Post-processing method of character recognition result | |
JP2972443B2 (en) | Character recognition device | |
JP2742263B2 (en) | Character segmentation device in online continuous character recognition device | |
JP2639314B2 (en) | Character recognition method | |
JPS60138689A (en) | Character recognizing method | |
JPS6055481A (en) | Pattern recognizing device | |
JPH09231314A (en) | On-line handwritten character recognizing device | |
JPH04280394A (en) | Character recognizing device and recognized character fixing method |