JPS63213094A - On-line character confirming device - Google Patents

On-line character confirming device

Info

Publication number
JPS63213094A
JPS63213094A JP62046976A JP4697687A JPS63213094A JP S63213094 A JPS63213094 A JP S63213094A JP 62046976 A JP62046976 A JP 62046976A JP 4697687 A JP4697687 A JP 4697687A JP S63213094 A JPS63213094 A JP S63213094A
Authority
JP
Japan
Prior art keywords
character
characters
strokes
candidate
stroke
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62046976A
Other languages
Japanese (ja)
Inventor
Koji Yura
浩司 由良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP62046976A priority Critical patent/JPS63213094A/en
Publication of JPS63213094A publication Critical patent/JPS63213094A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PURPOSE:To correctly select a character by testing the size relation and the positional relation of the candidate character of a character string when discriminate the character string inputted by hand writing into respective characters. CONSTITUTION:Every punctuation of the characters presumed among the hand written character string whose punctuations inputted from a tablet 1 are obscure characters are recognized based on the shape characteristic of one or plural strokes and the positional characteristic among the plural strokes included every period unit by a character recognition part 3, and the candidate of the character is obtained. The characters are recognized based on the discrimination of factors such as the number strokes detection 3a, stroke characteristic extracting 3b, positional relation decision among the strokes 3c, collation 3d with a dictionary 2 and character size detection 3e.

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明はタブレット等の座標入力装置を介して連続的に
筆記入力される複数の文字を効果的に認識することので
きるオンライン文字認識装置に関する。
[Detailed Description of the Invention] [Object of the Invention] (Industrial Application Field) The present invention is capable of effectively recognizing a plurality of characters continuously input by hand via a coordinate input device such as a tablet. Relating to an online character recognition device.

(従来の技術) 近時、例えばタブレット等の座標入力装置を介して筆記
入力された文字を認識し、文書作成等に供するオンライ
ン文字認識装置が注目されている。
(Prior Art) Recently, online character recognition devices that recognize characters input by hand via a coordinate input device such as a tablet and are used for document creation and the like have been attracting attention.

この種のオンライン文字認識装置は、基本的には文字パ
ターンのストロークの特徴とその組合せに着目し、1文
字毎に辞書に格納されたストロ−ク間特徴とその組合せ
の情報と前記タブレット等を介して入力された文字の筆
記ストロークの情報とを照合して文字認識するものであ
る。
This type of online character recognition device basically focuses on the stroke characteristics and combinations of strokes in a character pattern, and uses information on stroke characteristics and their combinations stored in a dictionary for each character and the tablet, etc. Characters are recognized by comparing the information on the writing strokes of the characters input through the computer.

しかして種々開発されているオンライン文字認識装置は
、一般に1文字を筆記入力する都度、所定の時間を経て
次の文字を筆記入力することによって文字の区切りを指
示するようにしたり、或いは文字記入枠を設けて1つの
文字記入枠毎に1文字を筆記入力するような制限を設け
ている。ところがこのような制限は、筆記者に相当の負
担を強いることになり、オンライン文字認識装置の普及
の妨げとなっている。
However, various online character recognition devices that have been developed generally have a system that indicates character separation by inputting the next character after a predetermined period of time each time a character is input by hand, or by inputting a character in a character entry frame. A restriction is set such that one character can be written in each character entry frame. However, such restrictions impose a considerable burden on scribes, and are hindering the widespread use of online character recognition devices.

そこで最近では、例えばr候補文字ラティス法による枠
無し筆記文字列のオンライン認識」 (電子通信宇金論
文集Vo1.J68−D No、4. P2O3,19
85)に紹介されるように、自由に筆記入力された複数
の文字から、つまり文字の区切りの不明な文字列から文
字の区切りを推定し、その推定された1文字分のストロ
ークの全ての組合せからその文字を認識して候補文字を
求め、これらの候補文字から文字を選択して最適な文字
列を生成することが考えられている。
Therefore, recently, for example, online recognition of frameless written character strings using the r candidate character lattice method" (Electronic Communication Ugan Papers Vol. 1. J68-D No. 4. P2O3, 19
As introduced in 85), character boundaries are estimated from multiple freely written characters, that is, character strings with unknown character boundaries, and all combinations of strokes for one character are estimated. One idea is to recognize the characters from the computer, find candidate characters, and select characters from these candidate characters to generate an optimal character string.

ところがこの方法では、候補文字から文字を選択した後
、最適な文字列を生成しているので、その計算処理が膨
大化する。この為、実時間処理する上で大きな課題が残
されている。
However, in this method, an optimal character string is generated after selecting a character from candidate characters, so the calculation process becomes enormous. For this reason, a major problem remains in real-time processing.

そこで本発明者は先に特願昭81−301495号にて
上述した問題を解決し得る文字認識装置を提唱した。こ
の文字認識装置は、座標入力装置を介して連続的に筆記
入力された複数の文字パターンの各ストロークの情報か
ら文字の区切りを推定し、この推定された区切り単位に
含まれる1つ乃至複数のストロークの特徴とそのストロ
ーク間の位置関係から各区切り単位における文字候補を
求める。
Therefore, the present inventor previously proposed a character recognition device capable of solving the above-mentioned problems in Japanese Patent Application No. 81-301495. This character recognition device estimates character divisions from information on each stroke of a plurality of character patterns continuously inputted via a coordinate input device, and identifies one or more characters included in this estimated division unit. Character candidates for each delimiter are determined from the characteristics of the strokes and the positional relationships between the strokes.

その後、求められた各区切り単位の文字候補のつながり
関係から文字を選択して、例えば連続した区切り単位の
候補文字のつながりであって、その文字数の最も少ない
組合せの文字列を認識結果として生成するようにしたも
のである。
After that, characters are selected from the obtained connection relationship of character candidates in each delimiter unit, and a character string is generated as a recognition result, for example, a combination of candidate characters in consecutive delimiter units with the smallest number of characters. This is how it was done.

このような手法によれば文字間の不明な文字列を簡易に
、且つ効果的に認識することができ実用上多大なる効果
が奏せられる。
According to such a method, a character string with unknown spaces between characters can be easily and effectively recognized, and a great practical effect can be achieved.

ところが筆記者によって記載され文字の大きさは様々で
あり、これに対応しようとすると、例えば濁点と「ハ」
とが誤認識されたり、また「ヨ」と「ヨ」の区別がつか
なくなる等の不具合が生じる。また文字の筆記間隔が狭
い場合には、「トノ」が「トノ」として誤認識される場
合も生じる。
However, the size of the characters written by different scribes varies, and when trying to accommodate this, for example, the ``dakuten'' and ``ha'' characters are different.
This causes problems such as ``Yo'' and ``Yo'' being misrecognized, and ``Yo'' and ``Yo'' becoming indistinguishable. Furthermore, if the writing intervals between characters are narrow, "tono" may be mistakenly recognized as "tono".

(発明が解決しようとする問題点) このように連続的に筆記入力された文字の区切りの不明
な文字列から各文字を認識する上で、文字の大きさや文
字間隔に起因する誤認識の問題が残されており、易いオ
ンライン文字認識装置を実用化する上でその改善が望ま
れている。
(Problems to be Solved by the Invention) When recognizing each character from a string of characters that are continuously input by hand with unknown delimiters, there is a problem of misrecognition caused by the size of the characters and the spacing between the characters. However, improvements are desired in order to put a simple online character recognition device into practical use.

本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、自由に筆記された文字の区切り
が不明な文字列から、その文字列を高速に、しかも精度
良く文字認識することができ、しかも濁点や拗音等も正
しく認識することのできる実用化に適したオンライン文
字認識装置を提供することにある。
The present invention was made in consideration of these circumstances, and its purpose is to quickly and accurately recognize characters from freely written character strings with unknown character delimiters. An object of the present invention is to provide an online character recognition device that is suitable for practical use and can also correctly recognize voiced marks, syllables, etc.

[発明の構成] (問題点を解決するための手段) 本発明は座標入力装置を介して連続的に筆記入力された
複数の文字パターンの各ストロークの情報から文字の区
切りを推定し、この推定された区切り単位に含まれる1
つ乃至複数のストロークの特徴とそのストローク間の位
置関係から各区切り単位における文字候補を求めたのち
、求めら゛れた各区切り単位の文字候補のつながり関係
から文字を選択して、例えば連続した区切り単位の候補
文字のつながりであって、その文字数の最も少ない組合
せの文字列を認識結果として生成するに際し、特に文字
列中の候補文字の大小関係および位置関係をそれぞれ検
定して、その文字選択を正しく行い得るようにしたこと
を特徴とするものである。
[Structure of the Invention] (Means for Solving the Problems) The present invention estimates the delimitation of characters from information on each stroke of a plurality of character patterns that are continuously input by hand via a coordinate input device, and uses this estimation. 1 included in the delimited unit
After determining character candidates in each delimiter unit from the characteristics of one or more strokes and the positional relationship between the strokes, characters are selected from the connection relationship of the character candidates in each delimiter unit. When generating a character string as a recognition result that is a combination of candidate characters in a delimiter unit with the smallest number of characters, the size and positional relationships of the candidate characters in the character string are examined in particular, and the character is selected. It is characterized by being able to perform correctly.

−6= (作用) 本発明によれば、区切りの不明な文字列がら推定される
文字の区切り毎に、その区切り単位に含まれる1つ乃至
複数のストロークの形状的、および複数のストローク間
の位置的な特徴から文字認識が行われ、候補文字が求め
られる。そしてそれらの候補文字の組合せから、連続し
た区切り単位の候補文字のつながりであって、その文字
数の最も少ない組合せの文字列を認識結果として求める
際、該文字列中の各候補文字の大小関係および位置関係
がそれぞれ検定される。
−6= (Function) According to the present invention, for each character delimiter estimated from a character string with unknown delimiters, the shape of one or more strokes included in that delimiter unit, and the Character recognition is performed based on positional features, and candidate characters are determined. From the combinations of these candidate characters, when determining the character string that is the combination of consecutive delimited candidate characters and has the smallest number of characters as a recognition result, the size relationship of each candidate character in the character string and the The positional relationships are each verified.

この結果、文字の区切り単位毎に正しく求められた候補
文字の中から、多くのストロークを含む候補文字が優先
的に選択されて文字列が生成されることになるので、文
字の区切りの不明な文字列を高速に認識することが可能
となる。
As a result, candidate characters with many strokes are preferentially selected from among the candidate characters correctly determined for each character delimiter, and a character string is generated. It becomes possible to recognize character strings at high speed.

また候補文字の大小関係の検定によって拗音等を正しく
認識することが可能となり、例えば「ヨ」と「ヨ」の誤
認識等を未然に防ぐことができる。
Furthermore, by examining the size relationship of candidate characters, it is possible to correctly recognize sulky sounds, etc., and it is possible to prevent erroneous recognition of, for example, "yo" and "yo".

更には候補文字の大小関係と位置関係の検定によって濁
点等を正しく認識することが可能となり、例えば「トノ
」を「トノ」や「トハノ」等と誤認識することを未然に
防ぐことが可能となる。この結果、自由に筆記入力され
た文字列を正確に認識することが可能となる。
Furthermore, by testing the size and positional relationships of candidate characters, it is possible to correctly recognize voiced marks, etc., making it possible to prevent erroneous recognition of ``tono'' as ``tono'' or ``tohano,'' for example. Become. As a result, it becomes possible to accurately recognize a character string freely input by hand.

(実施例) 以下、図面を参照して本発明の一実施例につき説明する
(Example) Hereinafter, an example of the present invention will be described with reference to the drawings.

第1図は実施例装置の概略構成図である。この装置は、
文字を座標値の系列(ストローク)として筆記入力する
為の座標入力装置(タブレット)■と、そのストローク
の情報を辞書2と照合して文字認識する文字認識部3と
、文字認識結果がら文字列を生成する文字列生成部4と
を備えて構成される。
FIG. 1 is a schematic configuration diagram of an embodiment device. This device is
A coordinate input device (tablet) for inputting characters by hand as a series of coordinate values (strokes), a character recognition unit 3 that recognizes characters by comparing the stroke information with a dictionary 2, and a character string based on the character recognition results. and a character string generation section 4 that generates.

辞書2は、例えば第2図に示すように認識対象文字のス
トローク情報を、その文字毎に記憶したものである。例
えば認識対象文字種がカタカナであるとすると、「ア」
についてはストローク数が2であり、その形状は「フ」
と「ノ」である等の情報と共に、これらのストロークの
位置関係の情報をそれぞれ登録して構成される。これら
のストロークの位置関係の情報は、例えば「フの起点は
ノの起点より上である。」 rフの起点はノの起点より
左である。」等の情報からなる。
The dictionary 2 stores stroke information of characters to be recognized, for each character, as shown in FIG. 2, for example. For example, if the character type to be recognized is katakana,
The number of strokes is 2, and its shape is "F".
It is configured by registering information on the positional relationship of these strokes, as well as information such as `` and ノ''. Information on the positional relationship of these strokes is, for example, ``The starting point of ``is above the starting point of ``.'' r The starting point of ``fu'' is to the left of the starting point of ``.''. ” and other information.

しかして文字認識部3は、例えば第3図に示すようにス
トローク検出部3a、ストロークの特徴抽出部3b、ス
トローク間の位置関係判定部3c、辞書辞書部3d、文
字サイズ検出部3e、バッファ3f等を備えて構成され
る。ストローク検出部3aは前記タブレット1を介して
筆記入力された文字ストロークを座標値の系列として検
出し、その始点および終点をそれぞれ検出している。同
時にそのストロークの終点を文字の終りと仮定して文字
認識処理を起動するものとなっている。
For example, as shown in FIG. 3, the character recognition section 3 includes a stroke detection section 3a, a stroke feature extraction section 3b, a positional relationship determination section 3c between strokes, a dictionary dictionary section 3d, a character size detection section 3e, and a buffer 3f. It is composed of the following. The stroke detecting section 3a detects character strokes input by hand via the tablet 1 as a series of coordinate values, and detects the starting point and ending point, respectively. At the same time, character recognition processing is started assuming that the end point of the stroke is the end of the character.

そして認識対象文字種が、例えばカタカナであり、濁点
や半濁点をそれぞれ1文字として認識処理を進める場合
には、その最大ストローク数が4であることから、上述
した如く仮定(推定)した文字の終り(文字の区切り)
から1ストローク。
If the character type to be recognized is, for example, katakana, and the recognition process is performed with each voiced and handakuten as one character, the maximum number of strokes is 4, so the end of the character assumed (estimated) as described above. (Character separation)
1 stroke from.

2ストローク、3ストローク、4ストロークと遡り、そ
れらの1つ乃至4つの各ストロークの組について前記辞
書2に登録されたストローク情報と照合処理している。
The steps are traced back to 2 strokes, 3 strokes, and 4 strokes, and each set of 1 to 4 strokes is compared with the stroke information registered in the dictionary 2.

例えば「ア」が筆記入力された場合には、先ずその第1
ストローク「フ」を検出した時点でこれを文字の区切り
と推定し、辞書2と照合する。この結果、文字「フ」の
ストロークの特徴と一致することから「フ」が候補文字
として求められる。
For example, if "A" is input by hand, first the first
When the stroke "fu" is detected, it is presumed to be a character break and compared with the dictionary 2. As a result, "F" is found as a candidate character because it matches the stroke characteristics of the character "F".

しかる後、第2のストローク「ノ」が、検出されると、
そのストロークの終点を文字の区切りとして1ストロー
ク「ノ」に対する認識処理が行われ、文字トノ」のスト
ロークの特徴と一致することから「ノ」が候補文字とし
て求められる。更にこの場合には、第2ストロークの終
点を区切りとして前のストロークに遡った2ストローク
「フ」 「ノ」に対する認識処理か行われる。
After that, when the second stroke "ノ" is detected,
Recognition processing is performed on one stroke "NO" using the end point of the stroke as a character delimiter, and since it matches the stroke characteristics of the character "TONO", "NO" is determined as a candidate character. Furthermore, in this case, recognition processing is performed for the two strokes ``fu'' and ``no'' tracing back to the previous stroke using the end point of the second stroke as a delimiter.

この場合、ストロークの形状だけからは辞書2に登録さ
れた「ア」 rカ」の特徴に該当することになるが、そ
のストローク間の位置関係から候補文字は「ア」だけが
求められる。即ち、第1ストローク「フ」と第2ストロ
ーク「ノ」の位置関係に注目すれば、 ■「フ」の起点は「ノ」の起点より上である。
In this case, from only the shape of the strokes, it corresponds to the characteristics of "A" r ka" registered in the dictionary 2, but only "A" is found as the candidate character from the positional relationship between the strokes. That is, if we pay attention to the positional relationship between the first stroke "F" and the second stroke "NO", (2) the starting point of "F" is above the starting point of "NO".

■「フ」の起点は「ノ」の起点より左である。■The starting point of "fu" is to the left of the starting point of "ノ".

■「フ」の屈曲点は「ノ」の起点より右である。■The bending point of "fu" is to the right of the starting point of "ノ".

■「フ」の終点は「ノ」の起点の近くである。■The ending point of "fu" is near the starting point of "ノ".

等の情報が求められ、これらの特徴に該当する特徴を有
する認識対象文字「ア」だけが候補文字として求められ
ることになる。そして認識対象文字「力」については、
そのストローク間の位置的な特徴が異なることから候補
文字から除外される。
The following information is obtained, and only the recognition target character "a" having features corresponding to these features is obtained as a candidate character. Regarding the character to be recognized, ``Chikara'',
Since the positional characteristics between the strokes are different, they are excluded from the candidate characters.

このようにして第2ストロークまでの候補文字がそれぞ
れ求められる。
In this way, candidate characters up to the second stroke are determined.

尚、カタカナ文字「フ」 「ノ」が連続して筆記入力さ
れた場合、これらの2つのストロークの形状的特徴だけ
からすれば候補文字として「ア」が求められる虞れがあ
るが、上述したようにそのストローク間の位置的関係の
照合も行われているので、本装置にあっては、候補文字
としては「フ」と「ノ」だけがそれぞれ求められること
になる。
In addition, if the katakana characters "F" and "ノ" are written in succession, there is a possibility that "A" will be required as a candidate character based only on the shape characteristics of these two strokes, but as mentioned above, Since the positional relationship between the strokes is also verified, the present device only requires ``fu'' and ``ノ'' as candidate characters.

しかる後、第3ストロークが検出されると、その第3ス
トロークの終点を文字の区切りとして1ストローク、2
ストローク、3ストロークの文字認識が行われ、それら
の各ストロークの組についてそれぞれ候補文字が求めら
れる。
After that, when the third stroke is detected, one stroke, two
Stroke and three-stroke character recognition is performed, and candidate characters are determined for each set of strokes.

同様にして第4ストロークが検出されると、その第4ス
トロークの終点を文字の区切りとして1ストローク、2
ストローク、3ストローク、4ストロークの文字認識が
行われる。そしてこれらの各ストロークの組の特徴(形
状的特徴と位置的関係の特徴)に適合した認識対象文字
が辞書2から得られると、その文字がそのストローク、
或いはストロークの組に対する候補文字として求められ
る。尚、候補文字が求められない場合には、次のストロ
ーク検出にその処理が進められる。
When the fourth stroke is detected in the same way, the end point of the fourth stroke is used as the delimiter for characters, and then one stroke, two
Stroke, 3-stroke, and 4-stroke character recognition is performed. Then, when a recognition target character that matches the characteristics of each set of strokes (shape characteristics and positional relationship characteristics) is obtained from the dictionary 2, that character
Alternatively, it is obtained as a candidate character for a set of strokes. Note that if no candidate character is found, the process proceeds to the next stroke detection.

以後このような処理が最大4ストロークの文字について
順に進められる。この結果、連続的に筆記入力されたス
トロークから辞書2に登録された認識対象文字のストロ
ークの特徴に合致する1つのストローク、或いは複数の
ストロークの組合せの候補文字だけが、推定された文字
の区切り単位における候補文字としてそれぞれ信頼性良
く求められる。この際、前記文字サイズ検出部3eにて
各候補文字のサイズがそれぞれ求められるようになって
いる。
Thereafter, such processing is sequentially performed for characters with a maximum of four strokes. As a result, only one stroke or a candidate character of a combination of multiple strokes that matches the stroke characteristics of the recognition target character registered in the dictionary 2 from continuously input strokes is the delimiter of the estimated characters. Each can be reliably found as a candidate character in a unit. At this time, the size of each candidate character is determined by the character size detection section 3e.

文字列生成部4は、このようにして文字認識部3で求め
られた候補文字について、文字の区切り単位が連続する
候補文字の組合せであって、その文字数が最小となる候
補文字列を求め、その候補文字列中の各候補文字の大小
関係および位置関係をそれぞれ検定して前記タブレット
1を介して連続的に筆記入力された文字列の認識結果を
求めるものとなっている。
For the candidate characters thus obtained by the character recognition section 3, the character string generation section 4 obtains a candidate character string that is a combination of candidate characters in which character delimiters are consecutive and has the minimum number of characters, The size and positional relationships of each candidate character in the candidate character string are examined to determine the recognition result of the character string continuously input by hand via the tablet 1.

即ち、検出されたストロークの全てが文字列中のいずれ
かの文字に含まれるように文字の区切りがなされ、且つ
その文字数が最小となる文字列であって、各候補文字の
大小関係と位置関係の検定に合格した文字列を信頼性の
高い認識結果として求めるものとなっている。
In other words, the characters are separated so that all of the detected strokes are included in one of the characters in the character string, and the number of characters is the minimum, and the size relationship and positional relationship of each candidate character are determined. Character strings that pass the test are considered to be highly reliable recognition results.

第4図はこのような認識処理過程を模式的に示したもの
で、住所名の一例として「コウホククカツタチョウ」な
るカタカナ文字列を連続的に筆記入力したときの認識処
理手順を示している。
Figure 4 schematically shows such a recognition process, and shows the recognition process when the katakana character string ``Kohokukukukatsutachō'' is continuously written as an example of an address name. .

第4図(a)に示すように連続的に筆記入力されたカタ
カナ文字列に対して、そのストロークは同図(b)に示
すように検出される。そしてこれらの各ストロークの終
点を文字の区切りと仮定した1つ乃至4つのストローク
の組に対する文字認識処理によって第4図(c)に示す
如き候補文字が求められる。
With respect to a katakana character string that is continuously input by hand as shown in FIG. 4(a), its strokes are detected as shown in FIG. 4(b). Candidate characters as shown in FIG. 4(c) are obtained by character recognition processing for a set of one to four strokes, assuming that the end point of each stroke is a character delimiter.

文字列生成部4は、このような候補文字から文字の区切
りが連続する、つまり全てのストロークが候補文字のい
づれかにそれぞれ含まれ、その文字数が最少となる文字
列を次のように求めている。
From these candidate characters, the character string generation unit 4 calculates a character string in which character breaks are continuous, that is, all strokes are included in one of the candidate characters, and the number of characters is the minimum, as follows. .

この例では、 ■ コウホクク力ツタチョウ ■ コウホククガノタチョウ の2つが、その文字数が最小となる文字列として求めら
れる。
In this example, the following two strings are found: ■ Kouhokukuri Tsutachicho ■ Kouhokukuganotacho.

この処理は、例えば常に最大のストローク数からなる候
補文字を、文字の区切り単位を連続させて順に検出して
いくことによって達せられる。
This process is achieved, for example, by sequentially detecting candidate characters having the maximum number of strokes in successive character division units.

しかる後、このようにして求められた候補文字列に対し
てその候補文字の大小関係および位置関係の検定を行う
。この検定処理は、前述した如く求められた文字サイズ
を順に比較することによって、また筆記ストロークの位
置座標から候補文字間の間隔を調べることによって行わ
れる。
Thereafter, the size relationship and positional relationship of the candidate characters are tested for the candidate character string obtained in this manner. This verification process is performed by sequentially comparing the character sizes determined as described above and by examining the spacing between candidate characters from the position coordinates of the writing strokes.

具体的には第5図に示すように候補文字列「コウホクク
力ッタチョウ」に対しては、その候補文字「ツ」が「イ
」とrノ」に分解し得る可能性があることから、先ず「
1X」についてその大きさと位置とからrハ」の誤認識
でないことを確認する。
Specifically, as shown in Figure 5, for the candidate character string ``Kouhokukurikitachou'', since there is a possibility that the candidate character ``tsu'' can be decomposed into ``i'' and ``rノ'', first "
From the size and position of "1X", confirm that it is not a misrecognition of "r".

その後、「イ」が前の候補文字「力」に近いか、或いは
分解された文字rノ」に近いかをそれらの位置関係から
調べ、「ガ」でないことを確認する。
Thereafter, it is checked whether "i" is close to the previous candidate character "chikara" or the decomposed character "r no" based on their positional relationship, and it is confirmed that it is not "ga".

この結果、候補文字「ツ」がrツ」以外の文字でないこ
とが検定確認される。
As a result, it is verified that the candidate character "tsu" is not a character other than "rtsu".

一方、候補文字「ヨ」については、その前後の= 15
− 候補文字の大きさと比較して「ヨ」であることを検定す
る。この検定は、例えばその前後9候補文字の大きさく
高さa)と該当文字の大きさく高さa)をそれぞれ求め
、且つ前後の文字に対する該当文字丈夫の余白の大きさ
く空間寸法C)を求める。そして、例えば b/a    <     315 なる条件で該当文字が拗音や促音等の小さい文字である
こと、また c/a    <     215 なる条件で前後の文字に比較して下方に記載されている
と判定し、該当文字が拗音や促音であると決定すれば良
い。このようにすれば、筆記文字自体の大きさに関係な
く、その文字の大きさの比率から拗音や促音を正確に認
識することが可能となる。
On the other hand, for the candidate character "yo", the values before and after it = 15
- Compare the size of the candidate character to verify that it is "Yo". This test, for example, calculates the size and height a) of the nine candidate characters before and after it, and the size and height a) of the corresponding character, and also calculates the space dimension C) of the margin of the corresponding character with respect to the characters before and after it. . For example, if b/a < 315, it is determined that the corresponding character is a small character such as a consonant or consonant, and if c/a < 215, it is determined that the character is written lower than the preceding and following characters. , it may be determined that the corresponding character is a consonant or a consonant. In this way, regardless of the size of the handwritten characters themselves, it becomes possible to accurately recognize consonants and consonants based on the size ratio of the characters.

尚、前述した「ツ」の検定に際しても、その文字高さd
と文字幅eとを求め、「)1」と「ノ」に分解可能な候
補文字が e/d    <     815 なる条件を満たすか否かを判定することで、それらが1
つの文字を形成するか否か、つまり上記の如く分解可能
な「\\」とrノ」が位置的に十分近いか否かを検定す
るようにすれば良い。
In addition, when testing the above-mentioned "tsu", the character height d
and the character width e, and determine whether the candidate characters that can be decomposed into ")1" and "ノ" satisfy the condition e/d < 815.
What is necessary is to test whether or not they form two characters, that is, whether or not "\\" and "rノ", which can be decomposed as described above, are sufficiently close in position.

以上のように本装置にあっては、ストロークの終点から
文字の区切りを推定し、その区切り単位におけるストロ
ークの形状的特徴、および複数のストロークの組合せに
ついてはそれらの位置関係から候補文字を順に求め、こ
れらの候補文字のつながりから、文字の区切りが連続し
、且つその文字数が最小となる文字列を求め、更にこの
文字列を形成する候補文字をその文字の大小関係および
位置関係に従って検定して最終的な認識結果を求めてい
る。従ってストロークの形状的特徴を単純に文字認識し
て求められた候補文字の中から個々に最適文字を求める
従来の処理に比較して、候補文字自体を信頼性良く求め
ることができるので、その最適文字列を非常に簡単な処
理によって、且つ短時間に求めることができる。しかも
濁点を誤認識することなく、また拗音や促音等を正確に
認識することができる。
As described above, this device estimates character divisions from the end points of strokes, and sequentially determines candidate characters based on the shape characteristics of the strokes in each division unit, and for combinations of multiple strokes, based on their positional relationships. , from the connection of these candidate characters, find a character string with consecutive character breaks and the minimum number of characters, and then test the candidate characters forming this character string according to the size relationship and positional relationship of the characters. We are looking for the final recognition result. Therefore, compared to the conventional process of finding the optimal character individually from among the candidate characters found by simply recognizing the shape characteristics of the stroke, the candidate character itself can be determined with high reliability, so it is possible to find the optimal character. Character strings can be obtained through very simple processing and in a short time. In addition, it is possible to accurately recognize consonants, consonants, etc. without erroneously recognizing voiced marks.

故に連続的に筆記入力された文字列を実時間処理によっ
て効率良く、しかも精度良く認識処理することが可能と
なり、実用性が非常に高い。
Therefore, it is possible to efficiently and accurately recognize character strings that have been continuously input by hand in real-time processing, which is extremely practical.

尚、本発明は上述した実施例に限定されるものではない
。ここでは認識対象文字種をカタカナとして説明したが
、カタカナ以外の文字種までを認識対処とすることも可
能であり、同様な手法を導入するだけで十分である。ま
た上述した検定条件は、例えば経験的に定めれば良いも
のであり、その手法も特に限定されない。その他、最小
文字数の文字列を選択するアルゴリズム等も種々変形可
能であり、要するに本発明はその要旨を逸脱しない範囲
で種々変形して実施することができる。
Note that the present invention is not limited to the embodiments described above. Although the character types to be recognized are described here as katakana, it is also possible to recognize character types other than katakana, and it is sufficient to introduce a similar method. Further, the above-mentioned test conditions may be determined empirically, for example, and the method thereof is not particularly limited. In addition, the algorithm for selecting a character string with the minimum number of characters can be modified in various ways, and in short, the present invention can be implemented in various modifications without departing from the gist thereof.

[発明の効果] 以上詳述したように本発明によれば、任意の大きさおよ
び文字間隔で自由に筆記され、文字の区切りが不明な文
字列を高速に、しかも正確に認識処理してその認識性能
の大幅な向上を図り得ると共に、筆記者に対する負担を
大幅に軽減してその取扱い性の向上を図り得る等の実用
上多大なる効果を奏する。
[Effects of the Invention] As detailed above, according to the present invention, it is possible to quickly and accurately recognize and process character strings freely written in any size and character spacing, with unknown character divisions. In addition to greatly improving recognition performance, the present invention has great practical effects, such as greatly reducing the burden on the scribe and improving its handling.

【図面の簡単な説明】[Brief explanation of the drawing]

図は本発明の一実施例を示すもので、第1図は実施例装
置の概略構成図、第2図は辞書の構成例を示す図、第3
図は文字認識部の構成例を示す図、第4図は文字認識手
続きの処理手順を模式的に示す図、第5図は候補文字列
に対する検定処理を説明する為の図である。 l・・・座標入力装置(タブレット)、2・・・辞書、
訃・・文字認識部、3a・・・ストローク検出部、3b
・・・ストロークの特徴抽出部、8c・・・ストローク
間の位置関係判定部、3d・・・辞書照合部、3e・・
・文字サイズ検出部、3r・・・バッファ、4・・・文
字列生成部。
The figures show one embodiment of the present invention, in which Fig. 1 is a schematic configuration diagram of the embodiment device, Fig. 2 is a diagram showing an example of the configuration of a dictionary, and Fig. 3
4 is a diagram showing an example of the configuration of a character recognition section, FIG. 4 is a diagram schematically showing a processing procedure of a character recognition procedure, and FIG. 5 is a diagram for explaining a verification process for candidate character strings. l... Coordinate input device (tablet), 2... Dictionary,
Death...Character recognition unit, 3a...Stroke detection unit, 3b
...Stroke feature extraction unit, 8c...Positional relationship determination unit between strokes, 3d...Dictionary matching unit, 3e...
-Character size detection section, 3r...Buffer, 4...Character string generation section.

Claims (3)

【特許請求の範囲】[Claims] (1)座標入力装置を介して連続的に筆記入力された複
数の文字パターンの各ストロークの情報から文字の区切
りを推定する手段と、この推定された区切り単位に含ま
れるストロークの特徴とストローク間の位置関係に従っ
て各区切り単位における文字候補を求める文字認識部と
、求められた各区切り単位の文字候補のつながり関係、
および文字候補の大小関係から文字を選択して文字列を
生成する文字列生成部とを具備したことを特徴とするオ
ンライン文字認識装置。
(1) A means for estimating character divisions from information on each stroke of a plurality of character patterns continuously inputted via a coordinate input device, and characteristics of strokes included in the estimated division units and stroke intervals. a character recognition unit that determines character candidates in each delimiter unit according to the positional relationship between the
and a character string generation unit that selects characters based on the size relationship of character candidates and generates a character string.
(2)文字認識部は、辞書に登録された認識対象文字の
ストロークの特徴および複数のストローク間の位置関係
の特徴と、区切り単位に含まれるストロークの特徴およ
び複数のストローク間の位置関係の特徴とを比較して、
その区切り単位における候補文字を求めるものである特
許請求の範囲第1項記載のオンライン文字認識装置。
(2) The character recognition unit recognizes the stroke characteristics and positional relationship characteristics between multiple strokes of the recognition target character registered in the dictionary, and the stroke characteristics included in the delimiter unit and the positional relationship characteristics between multiple strokes. Compare with
2. The online character recognition device according to claim 1, which obtains candidate characters in each delimiter.
(3)文字列生成部は、連続した区切り単位の候補文字
のつながりを各候補文字の大小関係および位置関係から
検定し、上記候補文字のつながりであって、その文字数
の最も少ない組合せの文字列を選択して行われるもので
ある特許請求の範囲第1項記載のオンライン文字認識装
置。
(3) The character string generation unit tests the connection of candidate characters in consecutive delimiting units based on the size relationship and positional relationship of each candidate character, and generates a character string that is a combination of the candidate characters and has the smallest number of characters. 2. The online character recognition device according to claim 1, wherein the on-line character recognition device is performed by selecting.
JP62046976A 1987-03-02 1987-03-02 On-line character confirming device Pending JPS63213094A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62046976A JPS63213094A (en) 1987-03-02 1987-03-02 On-line character confirming device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62046976A JPS63213094A (en) 1987-03-02 1987-03-02 On-line character confirming device

Publications (1)

Publication Number Publication Date
JPS63213094A true JPS63213094A (en) 1988-09-05

Family

ID=12762267

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62046976A Pending JPS63213094A (en) 1987-03-02 1987-03-02 On-line character confirming device

Country Status (1)

Country Link
JP (1) JPS63213094A (en)

Similar Documents

Publication Publication Date Title
US7596272B2 (en) Handling of diacritic points
US7756335B2 (en) Handwriting recognition using a graph of segmentation candidates and dictionary search
Wshah et al. Script independent word spotting in offline handwritten documents based on hidden markov models
US5917941A (en) Character segmentation technique with integrated word search for handwriting recognition
JP2000353215A (en) Character recognition device and recording medium where character recognizing program is recorded
EP0564827A2 (en) A post-processing error correction scheme using a dictionary for on-line handwriting recognition
JP2013033416A (en) Character recognition device, character recognition method, and program
EP2138959B1 (en) Word recognizing method and word recognizing program
KR100480316B1 (en) Character recognition method and apparatus using writer-specific reference vectors generated during character-recognition processing
JP4958236B2 (en) Method and apparatus for recognizing handwritten patterns
JPS63213094A (en) On-line character confirming device
JP2671984B2 (en) Information recognition device
Lee et al. On-line cursive script recognition using an island-driven search technique
JPS63155389A (en) On-line character recognizing device
JPH028348B2 (en)
KR100332752B1 (en) Method for recognizing character
JP3130392B2 (en) Character recognition device
JPS5866175A (en) Pattern recognizing device
JPH01191992A (en) Character recognizing device
JPS59103176A (en) On-line character recognizer
CN117875310A (en) Vertical domain text error correction method based on prefix and suffix word stock and confusion degree
JPH0668308A (en) Handwritten character recognizing device
JPS63301383A (en) Handwritten character recognition device
JP2000090200A (en) Method and device for character recognition and recording medium
JPH01169588A (en) On-line character recognizing device