JPS59103176A - On-line character recognizer - Google Patents
On-line character recognizerInfo
- Publication number
- JPS59103176A JPS59103176A JP57212213A JP21221382A JPS59103176A JP S59103176 A JPS59103176 A JP S59103176A JP 57212213 A JP57212213 A JP 57212213A JP 21221382 A JP21221382 A JP 21221382A JP S59103176 A JPS59103176 A JP S59103176A
- Authority
- JP
- Japan
- Prior art keywords
- line segment
- code
- circuit
- stroke
- basic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 29
- 238000005070 sampling Methods 0.000 abstract description 8
- 238000010586 diagram Methods 0.000 description 13
- 238000000034 method Methods 0.000 description 7
- 239000004575 stone Substances 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/1801—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Abstract
Description
【発明の詳細な説明】
産業上の利用分野
本発明は、使用者が筆記する文字の筆点座標と、その時
間経過情報を基にして、筆記された文字を認識するオン
ライン文字認識装置に関するものである。[Detailed Description of the Invention] Industrial Application Field The present invention relates to an online character recognition device that recognizes written characters based on the pen point coordinates of the characters written by the user and their time elapsed information. It is.
従来例の構成とその問題点
従来、オンライン文字認識においては、ペンのアンプ、
ダウン情報を用いて一筆で書かれた線分(以下、ストロ
ークと言う)を比較的容易に抽出することができるので
、−筆で書かれた入力ストロークがあらかじめ選択され
た複数の基本線分(以下、基本ストロークと言う)のど
れに一致するかを調べ(ストローク認識)、このストロ
ーク情報を用いて文字の認識を行なう手法が知られてい
る。あらかじめストローク認識を行なう上記の手法の利
点として、とりわけ手書漢字認識においては、入力文字
のストローク数すなわち画数を用いて辞書検索の範囲を
限定し、認識時間を著しく短縮することが可能である。Conventional structure and problems Traditionally, online character recognition uses a pen amplifier,
Since it is possible to relatively easily extract line segments written with a single stroke (hereinafter referred to as strokes) using down information, input strokes written with a brush can be extracted from multiple basic line segments (hereinafter referred to as strokes) selected in advance. A known method is to check which of the basic strokes (hereinafter referred to as basic strokes) matches (stroke recognition) and to recognize a character using this stroke information. An advantage of the above-described method of performing stroke recognition in advance is that, especially in handwritten kanji recognition, the number of strokes of input characters can be used to limit the range of dictionary search, thereby significantly shortening the recognition time.
しかし、従来のオンライン文字認識装置においては次に
述べるような欠点がある。第1図(a) 、 (b)
。However, conventional online character recognition devices have the following drawbacks. Figure 1 (a), (b)
.
(C) 、 (d) 、 (e)は手書漢字の様々な続
は字の例を示したものである。手書文字の場合は筆記者
に続は字を書かないように指示を与えた場合でも第1図
に示すような続は字が書かれる可能性が高く、また、日
常的に続は字を書く習慣の筆記者は意識的に正しい画数
で文字を書くことにはかなり抵抗を感じるものである。(C), (d), and (e) show examples of various zokuha characters in handwritten kanji. In the case of handwritten characters, even if the scribe is instructed not to write the next character, there is a high possibility that the next character will be written as shown in Figure 1, and it is also common for the scribe to write the next character. Scribes who have a habit of writing often feel a great deal of resistance to consciously writing letters with the correct number of strokes.
このように入力文字データとして続は字で書かれた文字
が予想される場合に、従来のストローク認識により得ら
れたストローク情報をそのまま文字認識に利用する手法
では、続は字は全て誤認識せたは認識不能となるか、も
しくは予想される続は字パターンのストローク情報も全
て辞書に記憶する手法を取るとしても実用上問題があっ
た。In this way, when the input character data is expected to be a character written in the character ``Zoku'', a method that uses the stroke information obtained by conventional stroke recognition as is for character recognition will not misrecognize all the characters ``Zoku''. Even if a method was adopted in which all the stroke information of the expected Zokuha character pattern was stored in the dictionary, there was a practical problem.
発明の目的
本発明の目的は、前述の従来例の欠点を解消し、辞書の
追加、認識時間の増大をほとんど必要とせずに続は字で
書かれた文字に対しても安定な認識手法を基にしたオン
ライン文字認識装置を提供することにある。OBJECTS OF THE INVENTION An object of the present invention is to eliminate the drawbacks of the conventional example described above, and to provide a stable recognition method even for characters written in Japanese characters, without adding a dictionary or increasing recognition time. The purpose of the present invention is to provide an online character recognition device based on
発明の構成
本発明のオンライン文字認識装置は、手書文字の筆点座
標と各筆点の時系列情報が入力される座標入力装置と、
手書文字を構成する一筆で書かれた線分の各々があらか
じめ選定された複数の基本線分のいずれに属するかを判
別して対応する基本線分コードを付与する基本線分識別
回路と、前記基本線分識別回路から出力される前記基本
線分コードを記憶して順次送出する線分コード送出回路
と、認識対象となる文字群のそれぞれの文字を構成する
線分如対応する基本線分コードと各筆点の時系列情報を
記憶して順次送出する辞書記憶部と、前記線分コード送
出回路から順次送出される入力手書文字の基本線分コー
ドと前記辞書記憶部から順次送出される基本線分コード
の一致を調べて線分コード一致信号を出力する比較回路
と、前記比較回路から供給される線分コード一致信号に
応答して文字の同定を行なう判定回路を具備し、かつ、
前記線分コード送出回路は、前記基本線分識別回路から
送出される基本線分コードを記憶する線分コードバッフ
ァと、前記線分コードバッファに入力された基本線分コ
ードの中からあらかじめ選定された分解されるべき基本
線分コードと一致するものを検出し、前記分解されるべ
き基本線分コードの種類ごとに、あらかじめ定められた
複数の基本線分コードに分解して順次出力する線分分解
回路を含めて構成したものであり、これにより、筆記さ
れる手書文字の確実な認識を行ない、良好な認識結果を
得るようにしたものである。Composition of the Invention The online character recognition device of the present invention includes a coordinate input device into which the pen point coordinates of handwritten characters and time series information of each pen point are input;
a basic line segment identification circuit that determines which of a plurality of pre-selected basic line segments each line segment written with one stroke constituting a handwritten character belongs to and assigns a corresponding basic line segment code; a line segment code sending circuit that stores and sequentially sends out the basic line segment codes output from the basic line segment identification circuit; and basic line segments that correspond to the line segments that constitute each character of the character group to be recognized. a dictionary storage section that stores and sequentially sends out codes and time-series information of each writing point; and basic line segment codes of input handwritten characters that are sequentially sent out from the line segment code sending circuit and sequentially sent out from the dictionary storage section. a comparison circuit that checks for a match between basic line segment codes and outputs a line segment code match signal; and a determination circuit that identifies characters in response to the line segment code match signal supplied from the comparison circuit; ,
The line segment code sending circuit has a line segment code buffer that stores the basic line segment code sent from the basic line segment identification circuit, and a line segment code that is selected in advance from among the basic line segment codes input to the line segment code buffer. A line segment that detects a line segment that matches a basic line segment code to be decomposed, decomposes it into a plurality of predetermined basic line segment codes for each type of basic line segment code to be decomposed, and sequentially outputs the decomposed basic line segment codes. This system includes a decomposition circuit, thereby ensuring reliable recognition of handwritten characters and obtaining good recognition results.
実施例の説明
以下、本発明の実施例について、図面を参照しながら説
明する。DESCRIPTION OF EMBODIMENTS Hereinafter, embodiments of the present invention will be described with reference to the drawings.
第2図は本発明の一実施ψ11のオンライン文字認識装
置の基本構成を示す要部ブロック図である。FIG. 2 is a block diagram of essential parts showing the basic configuration of an online character recognition device according to one embodiment ψ11 of the present invention.
第2図において、1は座標入力装置、2は座標入力装置
1の出力を入力する基本線分識別回路、3は基本−分識
別回路2の出力を入力して順次出力する線分コード送出
回路、4は線分コード送出回路3の出力と辞書記憶部6
の出力を比較する比較回路、6は比較回路4の出力を入
力して文字の同定を行なう判定回路、6は記憶している
辞書データを比較回路4に順次送出する辞書記憶部であ
る。In FIG. 2, 1 is a coordinate input device, 2 is a basic line segment identification circuit that inputs the output of the coordinate input device 1, and 3 is a line segment code sending circuit that inputs the output of the basic segment identification circuit 2 and sequentially outputs the output. , 4 are the output of the line segment code sending circuit 3 and the dictionary storage section 6
A comparison circuit 6 compares the outputs of the comparison circuit 4, a determination circuit 6 receives the output of the comparison circuit 4 and identifies characters, and a dictionary storage section 6 sequentially sends stored dictionary data to the comparison circuit 4.
以上のように構成された本実施例のオンライン文字認識
装置について、以下その動作を説明する。The operation of the online character recognition device of this embodiment configured as described above will be described below.
まず、座標入力装置1は手書文字の形を表現するに充分
な数の2次元座標点を時系列的にサンプリングする装置
であって、いわゆるディジタイザ−とペンを含んで構成
してもよいし、陰極線管(CRT)とライトペンで構成
してもよい。以下説明を容易にするために漢字の1石」
を例にとって各部の動作を説明する。First, the coordinate input device 1 is a device that chronologically samples a sufficient number of two-dimensional coordinate points to represent the shape of a handwritten character, and may include a so-called digitizer and a pen. , a cathode ray tube (CRT) and a light pen. To facilitate the explanation below, the kanji ``1 stone''
The operation of each part will be explained using as an example.
まず、座標入力装置1から出力される各サンプリング点
の座標点データと筆点の時系列情報(例えば、ペンのア
ンプ、ダウン状態、ペンの移動方向など)を供給された
基本線分識別回路2では、−筆のストロークすなわち最
初にペンダウンとなったサンプリング点から次にペンア
ップになる直前のサンプリング点までの各サンプリング
点間を補間して得られるひと続きの線分が、あらかじめ
選定しておいた基本線分コード(以下、基本ストローク
コードと言う)のいずれに属するかを判別し、対応する
ストロ−クコ〜ドを出力する。入力文字の1ストローク
に対し、基本ストロークコードの1つを割当てる手法と
しては、次のようなものがある。First, the basic line segment identification circuit 2 is supplied with the coordinate point data of each sampling point output from the coordinate input device 1 and the time series information of the writing point (for example, the amplifier of the pen, the down state, the moving direction of the pen, etc.) In this case, - the stroke of the brush, that is, a series of line segments obtained by interpolating between each sampling point from the first sampling point when the pen is down to the sampling point immediately before the next pen-up, is selected in advance. It is determined which of the basic line segment codes (hereinafter referred to as basic stroke codes) it belongs to, and the corresponding stroke code is output. The following methods are available for assigning one basic stroke code to one stroke of an input character.
まず、認識対象文字を特徴づけるあらかじめ選定された
基本線分をいくつかの直線要素に分割して各直線要素に
一定の方向コードを与え、方向コードの並びによって、
この基本線分の基本ストロークコードを定義しておく。First, a pre-selected basic line segment that characterizes the character to be recognized is divided into several straight line elements, a certain direction code is given to each line element, and the arrangement of the direction codes is used to
Define the basic stroke code for this basic line segment.
次に入力手書文字の各サンプリング点における時系列情
報が入力された時、各サンプリング点間を結ぶ直線要素
に対し、上記の基本ス]・ローフコードの定義に用いた
方向コードのいずれかを与え、各−筆のストロークを方
向コードの並びによって表現する。次に、この入力文字
の各ストロークの方向コード列と、あらかじめ選定され
た基本ストロークコードの方向コード列を順次比較し、
合致しない入力直線要素の長さの総計が最も小さくなる
基本ストロークが入力ストロークに最も一致度の高い基
本ストロークと判断して出力する。第3図(a)に本実
施例における方向コードの定義を示し、第3図(b)に
基本ストローク形とストロークコードおよびストローク
コードを定義する方向コードの並びの−例を示す。Next, when the time series information at each sampling point of input handwritten characters is input, one of the direction codes used to define the basic loaf code above is applied to the straight line element connecting each sampling point. Each brushstroke is represented by a sequence of direction codes. Next, the direction code string of each stroke of this input character is compared with the direction code string of the basic stroke code selected in advance,
The basic stroke for which the total length of input straight line elements that do not match is the smallest is determined to be the basic stroke with the highest degree of matching with the input stroke, and is output. FIG. 3(a) shows the definition of the direction code in this embodiment, and FIG. 3(b) shows an example of the arrangement of the basic stroke shape, the stroke code, and the direction code that defines the stroke code.
筆記者によって正しい画数で「石」が筆記された場合の
字形と基本線分識別回路2により識別された各ストロー
クのストロークコードとの対応を第4図に、また、続は
字で「石」が筆記された場合の字形とストロークコード
との対応を第5図に示す。なお、それらの図中の数字は
ストロークコードを表わす。Figure 4 shows the correspondence between the character shape and the stroke code of each stroke identified by the basic line segment identification circuit 2 when ``stone'' is written down by a scribe with the correct number of strokes. FIG. 5 shows the correspondence between character shapes and stroke codes when written. Note that the numbers in these figures represent stroke codes.
第4図の字形の入力文字のストロークコードは筆記され
た順にrl +314+7+ 1 Jと識別され、第5
図の字形の場合は[1,3,4,21Jである。The stroke codes of the input characters of the glyph shape shown in Figure 4 are identified as rl +314+7+ 1 J in the order of writing, and the 5th
In the case of the character shape shown in the figure, it is [1, 3, 4, 21J.
線分送出回路3では、基本線分識別回路2から順次送出
されるストロークコードを一担線分コードバッファ31
に記憶する。即ち、ストロークコード列「1,3,4,
7.IJもしくは「1,3゜4.21」が記憶される二
次に制御回路32は、判定回路6から送出される制御信
号を受信し、ストローク分解が要求されておれば線分コ
ードノ<)ノア31内のストロークコードを順次線分分
解回路33に送出するように動作させ、ストローク分解
が要求されていない場合は線分コードバッファ31内の
ストロークコードを直接比較回路4に送出するように動
作させる。ストロークの分解が要求される場合としては
、−担、検索すべき全辞書データとのマツチングを終了
しても、なお認識された文字が得られなかった場合と、
得られた結果が誤認識の可能性が高いと判断された場合
とが考えられる。例えば、比較回路4において、入力文
字のストロークコードと辞書記憶部6から送出されるス
トロークコードの比較を行なう時に、一致しないストロ
ークコードがあればエラーカウントを加算していき、エ
ラーカウントがあらかじめ定められた一定匝以下であれ
ば候補文字として保留しておくようにした場合、全辞書
データの検索が終了した時点でエラーカウントが「o」
の候補文字が存在すれば、その文字コードを出力するが
、「1」以上の候補文字しか存在しない場合は誤認識の
可能性が高いと判断してストローク分解を要求する制御
信号を送出し、再度辞書とのマツチングを行なう。In the line segment sending circuit 3, the stroke codes sequentially sent from the basic line segment identifying circuit 2 are stored in a line segment code buffer 31.
to be memorized. That is, the stroke code string "1, 3, 4,
7. The secondary control circuit 32 in which IJ or "1,3°4.21" is stored receives the control signal sent from the determination circuit 6, and if stroke decomposition is requested, the line segment code no. The stroke codes in the line segment code buffer 31 are sequentially sent to the line segment decomposition circuit 33, and when stroke decomposition is not requested, the stroke codes in the line segment code buffer 31 are directly sent to the comparison circuit 4. . Cases in which stroke decomposition is required include cases in which a recognized character is still not obtained even after matching with all the dictionary data to be searched;
There may be a case where it is determined that the obtained result is likely to be a misrecognition. For example, when the comparison circuit 4 compares the stroke code of an input character with the stroke code sent from the dictionary storage unit 6, if there is a stroke code that does not match, an error count is added, and the error count is determined in advance. If the characters are kept as candidate characters if they are less than a certain number, the error count will be set to "o" when the search for all dictionary data is completed.
If a candidate character exists, the character code is output, but if there are only candidate characters of "1" or more, it is determined that there is a high possibility of misrecognition, and a control signal is sent to request stroke decomposition. Perform matching with the dictionary again.
今、ストローク分解を要求する信号が送られていないも
のとすると、線分コード送出回路3からi分コードバソ
ファ内の入力文字のストロークコード[1,3,4,7
,I Jもしくは[1,3゜4.21Jが順次送出され
る。辞書記憶部6には認識対象となる各文字ごとにその
文字に特徴的なストロークコードが筆記される順序を考
慮して記述されている。1文字辞書のストロークコード
列の記述は、複数のストロークコードの可能性を許すも
のであってもよいし、部分的にストロークが筆記される
順序を固定しないような記述を含んでいてもよいし、い
くつかのストロークコード列のまとまりを別のひとつの
コードに置き換えた記述があってもよいし、更にストロ
−クコ−トリ、外の文字の特徴を表わす情報(例えば、
ストローク間のペンオフ時の移動力向、特定のサンプリ
ング点間の方向、距離、座標値の大小など)を含んでい
てもよい。寸た、本実施例においては認識対象文字の画
数ごとに辞書を複数のブロックに分割し、線分コード送
出回路3からストロークおよびストローク数を示す信号
を受は取り、検索する辞書ブロックを指定するように構
成されているものとする。辞書の構成を第6図に示す。Assuming that no signal requesting stroke decomposition is being sent, the line segment code sending circuit 3 sends the stroke code [1, 3, 4, 7] of the input character in the i-minute code bath
, I J or [1,3°4.21J are sent out in sequence. In the dictionary storage unit 6, stroke codes characteristic of each character to be recognized are written in consideration of the order in which they are written. The description of the stroke code string in the one-character dictionary may allow the possibility of multiple stroke codes, or may partially include a description that does not fix the order in which the strokes are written. , there may be a description in which a group of stroke code strings is replaced with another single code, and information representing the characteristics of characters outside the stroke code (for example,
(The direction of movement force during pen-off between strokes, the direction and distance between specific sampling points, the size of coordinate values, etc.) may also be included. In this embodiment, the dictionary is divided into a plurality of blocks according to the number of strokes of the character to be recognized, and signals indicating strokes and the number of strokes are received from the line segment code sending circuit 3 to specify the dictionary block to be searched. It shall be configured as follows. The structure of the dictionary is shown in FIG.
説明の便宜上、文字「石」の辞書がストロークコードの
みによって[1,3,4,7、I Jと記述されている
ものとして以下の説明を行なう。まず、第4図の字形の
文字(ストロークコード列「’ + 3 + ’ +
7+ ’ J )のストローク数6が線分コード送出回
路3から送出されると、比較回路4では、辞書記憶部6
の6画文字辞書の先頭から辞書データをひとつ取り出し
、ストロークコードとの一致を調べる。For convenience of explanation, the following explanation will be given assuming that the dictionary for the character "stone" is written as [1, 3, 4, 7, I J] only by stroke codes. First, the characters with the shape shown in Figure 4 (stroke code string ``' + 3 + ' +
When the stroke number 6 of 7+'J) is sent from the line segment code sending circuit 3, the comparison circuit 4 stores the number of strokes in the dictionary storage section
One piece of dictionary data is taken from the beginning of the six-stroke character dictionary and checked to see if it matches the stroke code.
1番目の辞書の記述が「1,3,1.4.I Jである
とする。1ず、入力ストロークコードと辞書のストロー
クコードが共に11」で一致するので、次のストローク
コードを調べる。2番目のストロークコードも一致する
。次のストロークコードを調べると、入力端は「4」、
辞書側は11」で一致しないのでエラーカウントを「1
」にする。Assume that the description in the first dictionary is "1, 3, 1. 4. I J. 1. First, since the input stroke code and the dictionary stroke code are both 11" and match, the next stroke code is checked. The second stroke code also matches. Examining the next stroke code, the input end is "4",
The dictionary side is ``11'' and does not match, so set the error count to ``1''.
”.
以下、同様にストロークコードの一致を調べる0この例
では一致しないストロークコードが3ストローク目と4
ストローク目の2つあるので、エラーカウント「2」と
いう一致状態を示す信号が判定部6に送出される。判定
部6では、この一致信号によって文字の同定を行なう。Below, check the match of the stroke codes in the same way. In this example, the stroke codes that do not match are the 3rd and 4th strokes.
Since there are two strokes, a signal indicating a matching state with an error count of "2" is sent to the determination unit 6. The determining unit 6 identifies characters based on this matching signal.
即ち、エラーカラン)rOJであれば、現在対応を調べ
た文字の文字コードを認識結果として出力して文字の認
識を終了する。また、エラーカウントが11」であれば
候補文字として登録し、「2」以上であれば可能性がな
いとしてリジェクトする。今、エラーカウントが「2」
であるから辞書に記述された1番目の文字はリジェクト
され、同様に次の辞書とのマツチングが繰り返される。That is, if it is an error callan)rOJ, the character code of the character whose correspondence is currently checked is output as the recognition result, and character recognition is ended. Further, if the error count is "11", it is registered as a candidate character, and if it is "2" or more, it is rejected as there is no possibility. The error count is now "2"
Therefore, the first character written in the dictionary is rejected, and matching with the next dictionary is repeated in the same way.
この時、ストローク分解を要求する信号は送出されない
0文字「石」の辞書とのマツチングを終了した時点で、
エラーカウントが「o」になるのべ「石」の文字コード
と入力文字の認識が終了したことを示す信号が出力され
て入力文字の認識が終了する。次に第6図に示した続は
字の場合には、ストローク数「4」が入力されるので、
入力ストロークコード「1゜3.4,21Jと4画辞書
ブロック内の辞書とのマツチングが行なわれる。文字り
石」の辞書は5画辞書ブロック内にあるので、4固辞1
の中にエラーカウント「0」となる文字が存在すれば、
その結果が出力されるが、得られる結果は誤認識である
。今、4画辞書ブロックの検索が終了してもエラーカウ
ント「0」の文字が存在しなかったとする。判定部6は
1回目の辞書検索が終了したことを示す信号を受は取っ
て、線分コード送出回路3にストローク分解を要求する
信号を出力する。At this time, a signal requesting stroke decomposition is not sent.When matching with the dictionary for the zero character "stone" is completed,
When the error count reaches "o", a signal indicating that recognition of the character code "stone" and the input character has been completed is output, and the recognition of the input character is completed. Next, in the case of the character Zoku shown in Figure 6, the number of strokes "4" is input, so
Matching of the input stroke code "1° 3.4, 21J with the dictionary in the 4-stroke dictionary block is performed. Since the dictionary for "mojiriishi" is in the 5-stroke dictionary block, 4-stroke dictionary 1
If there is a character with an error count of "0" in
The result is output, but the result obtained is a false recognition. Suppose now that there is no character with an error count of "0" even after the search of the four-stroke dictionary block is completed. The determining unit 6 receives a signal indicating that the first dictionary search has been completed, and outputs a signal requesting stroke decomposition to the line segment code sending circuit 3.
この信号により線分コード送出回路3では線分コードバ
ッファ31内の入力ストロークコードを順次線分分解3
2に送出し、まず、あらかじめ選定された分解すべきス
トロークコードが含まれているかどうかを調べる。含ま
れていない場合は検出されなかったことを示す信号を判
定回路6に送出し、判定回路6では1回目の辞書検索に
よって得られた候補文字のコードを出力するか、候補文
字分解すべきストロークコードが検出された場合は、そ
のストロークごとにあらかじめ選定された複数のストロ
ークコードに分解する。分解すべきストロークの例を第
7図(、)〜(d)に示す。本実施例においては、分解
すべきストロークコードの中にストロークコード「21
」が含まれており、あらかじめストロークコード「7」
と「1」に分解されるように定めである〔第8図(a)
、 (b)参照〕。入力文字のストロークコードの中
に「21」が含捷れているので、線分分解回路32でス
トロークコード「7」と「1」に分解されて、入力スト
ロークコード列はJl 、3,4,7,1jと変更され
る。Based on this signal, the line segment code sending circuit 3 sequentially decomposes the input stroke codes in the line segment code buffer 31 into line segment codes.
2, and first, it is checked whether the stroke code selected in advance to be decomposed is included. If it is not included, a signal indicating that it was not detected is sent to the determination circuit 6, and the determination circuit 6 either outputs the code of the candidate character obtained by the first dictionary search, or outputs the stroke that should be decomposed into the candidate character. If a code is detected, it is decomposed into a plurality of pre-selected stroke codes for each stroke. Examples of strokes to be decomposed are shown in FIGS. 7(,) to (d). In this embodiment, the stroke code "21" is included in the stroke code to be decomposed.
" is included, and the stroke code "7" is included in advance.
and "1" [Figure 8 (a)
, see (b)]. Since "21" is included in the stroke code of the input character, it is decomposed into stroke codes "7" and "1" by the line segment decomposition circuit 32, and the input stroke code string becomes Jl, 3, 4, 7.1j.
以下、1回目の辞書検索と同様に、今度は6画文字の辞
書とのマツチングを行ない、文字「石」がエラーカウン
ト「0」で認識される。ストローク分解後、2回目の辞
書検索を終了してもエラーカウント「0」の文字が存在
しなかった場合は、ストローク分解要求信号は出されず
、1回目の候補と2回目の候補の中からエラーカウント
の最も少ないものを認識文字として出力する。また、分
解すべきストロークコードの前後のストロークコードや
、その他の各筆点における時系列的な情報を判定条件と
して、分解するストロークコードを決定するように構成
することもできる。第9図にこの場合の基本構成プロ・
ツク図を示す。例えば第10図(a) 、 (b)はス
トロークコード10については最初に筆記されたストロ
ークだけ分解するというル−ルの適用例、第11図(a
) 、 (1))および第12図(a)。Thereafter, in the same way as the first dictionary search, matching with the six-stroke character dictionary is performed, and the character "stone" is recognized with an error count of "0". After stroke decomposition, if a character with an error count of "0" does not exist even after completing the second dictionary search, a stroke decomposition request signal is not issued, and only one of the first and second candidates is searched. Output the character with the lowest error count as the recognized character. Further, the stroke code to be decomposed can be determined using the stroke codes before and after the stroke code to be decomposed and other time-series information at each writing point as the determination conditions. Figure 9 shows the basic configuration program in this case.
Show the diagram. For example, FIGS. 10(a) and 10(b) are examples of applying the rule that only the first stroke written for stroke code 10 is decomposed, and FIG. 11(a)
), (1)) and Figure 12(a).
(b)uストロークコード「21」について、直前のス
トロークコードによって分解するストロークコードが決
まる例を示す0
発明の効果
以上の説明から明らかなように、本発明は座標入力装置
、基本線分識別回路、線分コード送出回路、辞書記憶部
、比較回路1判定回路を具備するオンライン文字認識装
置において、線分コード送出回路は入力文字のストロー
クコードを言己憶する線分コードバッファド、線分コー
ドノくソファ内のストロークコードに特定のストローク
コード力玉含まれている場合、必要に応じてあら力1じ
め選められたストロークコードに分解して送出する線分
分解回路によって構成しているので、従来のストローク
抽出法によるオンライン文字認識の手法においては困難
とされていた続は字の認識を、辞書の追加を必要とせず
、−!た認識速度を大幅にイ氏下させることなく可能に
するという優れた効果75−得られる。その効果により
、文字の筆記者は1部分的にストロークがつながってし
まうことをあまり意識せずに文字を入力することができ
、特に続は字を書く習慣のある筆記者にとっても抵抗な
く使用できるオンライン文字認識装置を提供すること7
5二できる。(b) For the u stroke code "21", an example is shown in which the stroke code to be decomposed is determined by the immediately preceding stroke code 0 Effects of the Invention As is clear from the above description, the present invention provides a coordinate input device and a basic line segment identification circuit. , an online character recognition device that includes a line segment code sending circuit, a dictionary storage unit, and a comparison circuit 1 determination circuit, the line segment code sending circuit has a line segment code buffer that stores the stroke code of an input character, and a line segment code buffer that stores the stroke code of an input character. If the stroke code in the sofa contains a specific stroke code, it is configured with a line segment decomposition circuit that decomposes it into a pre-selected stroke code and sends it out if necessary. , it is possible to recognize the ``Zoku'' character, which was considered difficult with the conventional online character recognition method using stroke extraction, without the need for an additional dictionary. An excellent effect 75 can be obtained in that the recognition speed can be made possible without significantly reducing the recognition speed. Due to this effect, scribes can input characters without being too conscious of the fact that strokes are connected in one part, and even scribes who have a habit of writing characters can use it without any hesitation. Providing an online character recognition device7
I can do 52.
さらに1判定回路からの制御信号によって線分コードバ
ッファ内のストロークコードを線分分解回路に送出する
かしないかを判定する構成をとることにより、必要以上
のストロークを分解することによる誤認識の危険性や、
そのつとストロークコードのチェックを行なうことによ
る認識速度の低下を免かれるという効果が得られる。Furthermore, by adopting a configuration that determines whether or not to send the stroke code in the line segment code buffer to the line segment decomposition circuit based on the control signal from the first determination circuit, there is a risk of misrecognition due to decomposition of more strokes than necessary. Sex and
Another advantage is that the reduction in recognition speed caused by checking the stroke code can be avoided.
さらに、線分分解回路を分解すべきストロークコードの
前後のストローク、コードおよびその他の時系列情報に
よって分解するストロークを決定する条件判定部と線分
分解部によって構成することにより、続は字によるスト
ロークコードとそうでないストロークコードを厳密に区
別し、より正確なストロークコード分解を行なうことが
可能となり、認識率を向上させるという効果が得られる
。Furthermore, by configuring the line segment decomposition circuit with a condition judgment unit that determines the strokes to be decomposed before and after the stroke code to be decomposed, the code and other time-series information, and a line segment decomposition unit, it is possible to It is possible to strictly distinguish between stroke codes and other stroke codes, and to perform more accurate stroke code decomposition, resulting in the effect of improving the recognition rate.
第1図(a)〜(、)は続は字の例を示す字形図、第2
図は本発明の一実施例に係るオンライン文字認識装置の
基本構成を示す要部ブロック図、第3図(a)は方向コ
ードの定義図、第3図(b)は基本ストローク形、スト
ロークコードおよびストロークコードを定義する方向コ
ードの並びの対応図、第4図は正しい画数の字形とスト
ロークコードの対応図、第6図は続は字の字形とストロ
ークコードの対応図、第6図は辞書記憶部の詳細な構成
図、第7図(a)〜(d)は分解すべきストロークの形
体図、第8図(a) 、 (b)はストローク分解の例
を示す形体図、第9図は本発明の他の実施例に係るオン
ライン文字認識装置の基本構成を示す要部ブロック図、
第10図、第11図、および第12図の各(a) 、
(b)は判定条件を用いたストローク分解の例を示す形
体図である。
1・・・座標入力装置、2・・・・・・基本線分識別回
路、3・・・・・線分コード送出回路、4・・・比較回
路、6・・判定回路、6・・・・・辞書記憶部、31・
・・ 線分コードバッファ、32・・・・線分分解回路
、33・・・制御回路、32a・・・・・条件判定部、
32b・線分分解部。
代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図
−)3R
第3図
(C1)
第4図
第6図
第7図
(θ) /b)スLローク3
−F 7
/
−559−
月や
第10図
第11図
ス)、ローフコード2f
第12図
スμトタコーt どIFigures 1 (a) to (,) are glyph diagrams showing examples of glyphs;
The figure is a block diagram of main parts showing the basic configuration of an online character recognition device according to an embodiment of the present invention, FIG. 3(a) is a definition diagram of a direction code, and FIG. 3(b) is a basic stroke type and stroke code. and a correspondence diagram of the arrangement of direction codes that define stroke codes, Figure 4 is a correspondence diagram of character shapes with the correct number of strokes and stroke codes, Figure 6 is a correspondence diagram of character shapes and stroke codes, and Figure 6 is a dictionary. Detailed configuration diagram of the storage unit, FIGS. 7(a) to (d) are diagrams of the shape of strokes to be decomposed, FIGS. 8(a) and (b) are diagrams of the shape showing an example of stroke decomposition, and FIG. 9 is a main part block diagram showing the basic configuration of an online character recognition device according to another embodiment of the present invention,
Each (a) of FIG. 10, FIG. 11, and FIG. 12,
(b) is a feature diagram showing an example of stroke decomposition using determination conditions. DESCRIPTION OF SYMBOLS 1... Coordinate input device, 2... Basic line segment identification circuit, 3... Line segment code sending circuit, 4... Comparison circuit, 6... Judgment circuit, 6... ...Dictionary storage section, 31.
... Line segment code buffer, 32... Line segment decomposition circuit, 33... Control circuit, 32a... Condition determination unit,
32b・Line segment decomposition part. Name of agent: Patent attorney Toshio Nakao and 1 other person No. 1
Figure-) 3R Figure 3 (C1) Figure 4 Figure 6 Figure 7 (θ) /b) Slow L stroke 3
-F 7 / -559- Moon, Fig. 10, Fig. 11), Loaf cord 2f Fig. 12, μ Totakot Do I
Claims (2)
される座標入力装置と、手書文字を構成する一筆で書か
れた線分の各々があらかじめ選定された複数の基本線分
のいずれに属するかを判別して対応する基本線分コード
を付与する基本線分識別回路と、前記基本線分識別回路
から出力される前記基本線分コードを記憶して順次送出
する線分コード送出回路と、認識対象となる文字群のそ
れぞれの文字を構成する線分に対応する基本線分コード
と各筆点の時系列情線を記憶して順次送出する辞書記憶
部と、前記線分コード送出回路から順次送出される入力
手書文字の基本線分コードと前記辞書記憶部から順次送
出される基本線分コードの一致を調べて線分コード一致
信号を出力する比較回路と、前記比較回路から供給され
る線分コード一致信号に応答して文字の固定を行なう判
定回路を具備し、かつ、前記線分コード送出回路は、前
記基本線分識別回路から送出される基本線分コードを記
憶する線分コードバッファと、前記線分コードバッファ
に入力された基本線分コードの中からあらかじめ選定さ
れた分解されるべき基本線分コードと一致するものを検
出し前記分解されるべき基本線分コードの種類ごとに、
あらかじめ定められた複数の基本線分コードに分解して
順次出力する線分分解回路を含めて構成されていること
を特徴とするオンライン文字認識装置。(1) A coordinate input device into which the pen point coordinates of handwritten characters and time-series information of each writing point are input, and a plurality of bases in which each line segment written with one stroke constituting handwritten characters is selected in advance. a basic line segment identification circuit that determines which line segment it belongs to and assigns a corresponding basic line segment code; and a line that stores and sequentially sends out the basic line segment codes output from the basic line segment identification circuit. a minute code sending circuit; a dictionary storage unit that stores and sequentially sends out basic line segment codes corresponding to line segments constituting each character of the character group to be recognized and the time-series path lines of each writing point; a comparison circuit that checks whether the basic line segment codes of input handwritten characters sequentially sent from the line segment code sending circuit match the basic line segment codes sequentially sent from the dictionary storage unit and outputs a line segment code matching signal; The line segment code sending circuit includes a determination circuit that fixes a character in response to a line segment code matching signal supplied from the comparison circuit, and the line segment code sending circuit is configured to detect the basic line segment sent from the basic line segment identification circuit. A line segment code buffer that stores codes, and a line segment code that matches a preselected basic line segment code to be decomposed from among the basic line segment codes input to the line segment code buffer, and the code to be decomposed. For each type of basic line segment code,
An online character recognition device characterized by comprising a line segment decomposition circuit that decomposes into a plurality of predetermined basic line segment codes and sequentially outputs them.
一致信号に応答して文字の同定を行なうとともに、文字
の同定が終了または未終了の状態であることを示す制御
信号を出力するように構成されており、線分コード出力
回路は、前記判定回路から送出される制御信号に応答し
て、線分コードバッファ内の基本線分コードを直接前記
比較回路に送出するか前記線分コードバッファ内の基本
線分コードを線分分解回路に送出して前記線分分解回路
からの出力を前記比較回路に送出するかの判定を行なう
制御回路を含めて構成されていることを特徴とする特許
請求の範囲第(1)項記載のオンライン文字認識装置。 (39線分分解回路は、あらかじめ選定された分解され
るべき基本線分コードが供給された場合に前記分解され
るべき基本線分コードの前後の基本コードおよび前記座
標人力i置から供給される各筆点の時系列情報を判定条
件として用いて前記分解されるべき基本線分コードを分
解する基本線分コードを決定する条件判定部と、前記条
件判定部より出力される判定結果に基づいて前記分解さ
れるべき基本線分コードをあらかじめ選定された複数の
基本線分コードに分解する線分分解部をまめで構成され
ていることを特徴とする特許請求の範囲第(1)項また
は第(2)項記載のオンライン文字認識装置。(2) The determination circuit performs character identification in response to the line segment code matching signal output from the comparison circuit, and outputs a control signal indicating whether character identification has been completed or not yet completed. The line segment code output circuit is configured to either directly send the basic line segment code in the line segment code buffer to the comparison circuit in response to a control signal sent from the determination circuit, or output the basic line segment code from the line segment code to the comparison circuit. The present invention is characterized in that it includes a control circuit that sends the basic line segment code in the buffer to the line segment decomposition circuit and determines whether to send the output from the line segment decomposition circuit to the comparison circuit. An online character recognition device according to claim (1). (39 line segment decomposition circuits, when a preselected basic line segment code to be decomposed is supplied, are supplied from the basic codes before and after the basic line segment code to be decomposed and the coordinates manually set. a condition determination section that determines a basic line segment code for decomposing the basic line segment code to be decomposed using time series information of each writing point as a determination condition; Claim (1) or Claim 1, characterized in that the line segment decomposition unit that decomposes the basic line segment code to be decomposed into a plurality of pre-selected basic line segment codes is constituted by Mame. The online character recognition device described in (2).
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57212213A JPS59103176A (en) | 1982-12-02 | 1982-12-02 | On-line character recognizer |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57212213A JPS59103176A (en) | 1982-12-02 | 1982-12-02 | On-line character recognizer |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS59103176A true JPS59103176A (en) | 1984-06-14 |
JPH0210473B2 JPH0210473B2 (en) | 1990-03-08 |
Family
ID=16618802
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57212213A Granted JPS59103176A (en) | 1982-12-02 | 1982-12-02 | On-line character recognizer |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS59103176A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62120589A (en) * | 1985-11-20 | 1987-06-01 | Sanyo Electric Co Ltd | Hand-written character recognizing device |
JPH01234986A (en) * | 1988-03-16 | 1989-09-20 | Fujitsu Ltd | Character segmenting system |
CN109254799A (en) * | 2018-08-29 | 2019-01-22 | 新华三技术有限公司 | The starting method, apparatus and communication equipment of bootstrap |
-
1982
- 1982-12-02 JP JP57212213A patent/JPS59103176A/en active Granted
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62120589A (en) * | 1985-11-20 | 1987-06-01 | Sanyo Electric Co Ltd | Hand-written character recognizing device |
JPH01234986A (en) * | 1988-03-16 | 1989-09-20 | Fujitsu Ltd | Character segmenting system |
CN109254799A (en) * | 2018-08-29 | 2019-01-22 | 新华三技术有限公司 | The starting method, apparatus and communication equipment of bootstrap |
Also Published As
Publication number | Publication date |
---|---|
JPH0210473B2 (en) | 1990-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5211334B2 (en) | Handwritten symbol recognition method and apparatus | |
KR100297482B1 (en) | Method and apparatus for character recognition of hand-written input | |
JPH0562391B2 (en) | ||
JPS59139485A (en) | Pattern identification method and apparatus | |
JPH0684006A (en) | Method of online handwritten character recognition | |
JP2000516376A (en) | Error reduction of handwriting recognizer using decision tree | |
Rosenbaum et al. | Multifont OCR postprocessing system | |
KR20070090188A (en) | Method and device for recognition of handwritten patterns | |
CN111126160B (en) | Intelligent Chinese character structure evaluation method and system constructed based on five-stroke input method | |
JPS59103176A (en) | On-line character recognizer | |
Boubaker et al. | GLoBD: geometric and learned logic algorithm for straight or curved handwriting baseline detection. | |
CN110059180A (en) | Author identification and assessment models training method, device and storage medium | |
KR100301216B1 (en) | Online text recognition device | |
Xiao et al. | On-line handwritten Chinese character recognition directed by components with dynamic templates | |
AU2021101278A4 (en) | System and Method for Automatic Language Detection for Handwritten Text | |
JPH0950491A (en) | Method for recognizing handwritten character on-line and device therefor | |
JP3419251B2 (en) | Character recognition device and character recognition method | |
JP2671984B2 (en) | Information recognition device | |
JP3365538B2 (en) | Online character recognition method and apparatus | |
JPS5835674A (en) | Extracting method for feature of online hand-written character | |
KR940001739B1 (en) | On-line hand-written korean character recognition method by recognizing stroke | |
JP2924040B2 (en) | Handwritten character recognition device | |
JPH01169588A (en) | On-line character recognizing device | |
Goa et al. | Learning on-line hand-written characters | |
JPS59186074A (en) | Method for recognizing character with on-line system |