JPH0652363A - On-line handwritten character recognizing method - Google Patents

On-line handwritten character recognizing method

Info

Publication number
JPH0652363A
JPH0652363A JP4201195A JP20119592A JPH0652363A JP H0652363 A JPH0652363 A JP H0652363A JP 4201195 A JP4201195 A JP 4201195A JP 20119592 A JP20119592 A JP 20119592A JP H0652363 A JPH0652363 A JP H0652363A
Authority
JP
Japan
Prior art keywords
stroke
character
reprocessing
strokes
threshold value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4201195A
Other languages
Japanese (ja)
Inventor
Gakuhei Riyuu
学平 劉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP4201195A priority Critical patent/JPH0652363A/en
Publication of JPH0652363A publication Critical patent/JPH0652363A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To improve a recognition rate by analyzing the refusal cause of a recognition refusal character, and performing reprocessing considering character size, stroke size, and distance between strokes. CONSTITUTION:A character is inputted by moving an electronic pen 2 on a tablet 1. An on-line character data input part 3 converts and accepts an input character as a time series data. Character structure pre-processed by a pre- processing part 4, after being analyzed by a structure analysis part 5, is matched with the model of a dictionary 7, and recognition processing is applied to it. A reprocessing part 8 performs the reprocessing on character data for which recognition is refused at a recognition part 6 by using two kinds of noise eliminating methods and three kinds of stroke connecting methods, and the data is delivered to the structure analysis part 5.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、認識できない文字の拒
否原因を解析して、最適な再処理を行うオンライン手書
き文字認識方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an on-line handwritten character recognition method for analyzing the cause of rejection of unrecognizable characters and performing optimum reprocessing.

【0002】[0002]

【従来の技術】オンライン手書き文字認識装置は、タブ
レット上での電子ペンの移動方向情報を直接用いること
によって、文字をリアルタイムに認識するものである。
また、その認識方法としては、入力文字の各ストローク
の方向コード列を生成して、その特徴を調べる方法と、
各ストロークの座標位置すなわち端点、屈折点等を特徴
とする方法等が知られている。なお、この種の関連する
先行技術としては、例えばIEEE TRANSACT
IONS ON PATTERN ANALYSIS
AND MACHINE INTELLIGENCE.
VOL.12,NO.8 AUGUST 1990 p
p787−803等が挙げられる。
2. Description of the Related Art An on-line handwritten character recognition device recognizes characters in real time by directly using the moving direction information of an electronic pen on a tablet.
In addition, as the recognition method, a method of generating a direction code string of each stroke of the input character and examining its characteristics,
A method is known in which the coordinate position of each stroke, that is, the end point, the inflection point, and the like are characterized. Note that, as a related prior art of this kind, for example, IEEE TRANSACT
IONS ON PATTERN ANALYSIS
AND MACHINE INTELLIGENCE.
VOL. 12, NO. 8 August 1990 p
p787-803 and the like.

【0003】[0003]

【発明が解決しようとする課題】上記したオンライン手
書き文字認識装置においては、電子ペンの滑りや、不規
則な電子ペンの動きなどによって、手書き文字データに
切れ(ストロークの切れ)が生じて文字認識が拒否され
ることがある。従来、このような認識できない文字デー
タについて、空間的な情報と時間的な情報を利用して、
種々の再処理を行って認識率を向上させていた。例え
ば、前後2点間の距離がある閾値(10ピクセル)以下
の場合、この2点をストロークで連結することによって
認識率を向上させた認識方法がある(Pattern
Recognition ,Vol.16,No.5,
pp447−458,1983)。
In the above-described online handwritten character recognition apparatus, character recognition is performed by causing a break (stroke break) in the handwritten character data due to slipping of the electronic pen, irregular movement of the electronic pen, or the like. May be rejected. Conventionally, regarding such unrecognizable character data, using spatial information and temporal information,
The recognition rate was improved by performing various reprocessing. For example, when the distance between two points before and after is less than a threshold value (10 pixels), there is a recognition method in which the recognition rate is improved by connecting these two points with a stroke (Pattern).
Recognition, Vol. 16, No. 5,
pp 447-458, 1983).

【0004】しかしながら、上記した従来の方法では、
ストロークの切れの長さと文字のサイズとの相対性を考
慮していないため、ノイズを取り込んで認識したり、あ
るいはノイズとして除去すべきでない短いストロークを
除去して認識してしまうという問題があった。
However, in the above-mentioned conventional method,
There is a problem that noise is taken in and recognized, or short strokes that should not be removed as noise are removed and recognized because the relativity between the stroke length and the character size is not considered. .

【0005】本発明の目的は、認識拒否文字の拒否原因
を解析し、文字サイズ、ストロークサイズ、ストローク
間の距離を考慮した多段階な再処理を行って認識率を向
上させたオンライン手書き文字認識方法を提供すること
にある。
An object of the present invention is to analyze the cause of rejection of a recognition-rejected character and perform online multi-step reprocessing in consideration of the character size, stroke size, and distance between strokes to improve the recognition rate of online handwritten character recognition. To provide a method.

【0006】[0006]

【課題を解決するための手段】前記目的を達成するため
に、請求項1記載の発明では、オンライン手書き文字認
識装置における認識拒否文字の再処理方法において、認
識拒否された文字データの拒否原因を解析し、該拒否原
因と、該拒否データに対して既に適用された再処理の手
順が書き込まれた表とを参照して、再処理を行うか否か
を決め、再処理を行うとき、登録された複数の再処理方
法を適用して再処理を実行し、適用された再処理方法を
前記表に書き込むことを特徴としている。
In order to achieve the above object, according to the invention of claim 1, in a method of reprocessing a recognition-rejected character in an online handwritten character recognition apparatus, a cause of rejection of character data that has been rejected is recognized. By analyzing the cause of refusal and the table in which the reprocessing procedure already applied to the refusal data is written, it is determined whether or not reprocessing is performed, and when reprocessing is performed, registration is performed. It is characterized in that the plurality of applied reprocessing methods are applied to perform the reprocessing, and the applied reprocessing methods are written in the table.

【0007】請求項2記載の発明では、文字を構成する
一乃至複数のストロークであり、該ストロークを囲む長
方形の対角線の長さをストロークサイズとし、該文字を
囲む長方形の対角線の長さを文字サイズとし、前記再処
理方法は、第1のストロークサイズと該第1のストロー
クが属する文字のサイズとの比率が所定の閾値より小さ
いとき、前記第1のストロークをノイズと判定して、前
記第1のストロークが属する文字から第1のストローク
を除去する処理であることを特徴としている。
According to a second aspect of the present invention, a stroke size is one or a plurality of strokes forming a character, and a length of a diagonal line of a rectangle surrounding the stroke is a stroke size, and a length of a diagonal line of a rectangle surrounding the character is a character size. In the reprocessing method, when the ratio between the first stroke size and the size of the character to which the first stroke belongs is smaller than a predetermined threshold value, the first stroke is determined to be noise and the first stroke is determined to be noise. It is characterized in that it is a process of removing the first stroke from the character to which one stroke belongs.

【0008】請求項3記載の発明では、2ストローク以
上の文字であり、第2のストロークを囲む長方形と第3
のストロークを囲む長方形との重なり部分がないとき、
該第2のストロークの点列と該第3のストロークの点列
の間の最短距離を、第2、第3のストローク間の距離と
し、前記再処理方法は、第4のストロークのストローク
サイズとストローク間距離の比率が所定の閾値より小さ
く、且つ該ストローク間距離と文字サイズの比率が所定
の閾値より大きいとき、前記第4のストロークをノイズ
と判定して、前記第4のストロークが属する文字から第
4のストロークを除去する処理であることを特徴として
いる。
According to the third aspect of the invention, the character is a character having two or more strokes, and a rectangle enclosing the second stroke and a third character.
When there is no overlap with the rectangle surrounding the stroke of,
The shortest distance between the point sequence of the second stroke and the point sequence of the third stroke is defined as the distance between the second and third strokes, and the reprocessing method is the stroke size of the fourth stroke. When the ratio of the distance between strokes is smaller than a predetermined threshold value and the ratio of the distance between strokes and the character size is larger than a predetermined threshold value, the fourth stroke is determined to be noise and the character to which the fourth stroke belongs. Is a process for removing the fourth stroke from.

【0009】請求項4記載の発明では、第5のストロー
クの最後の2点をp1,p2とし、後続する第6のスト
ロークの最初の2点をp3,p4とし、点p1,p2で
形成されるベクトルと点p3,p4で形成されるベクト
ルの角度差の絶対値を、第5ストロークと第6ストロー
クとのペンアップ/ペンダウン角度差とし、点p1,p
2で形成されるベクトルと点p2,p3で形成されるベ
クトルとの角度差の絶対値を、第5ストロークと第6ス
トロークとの接続角度差とし、点p2とp3間の距離を
第5ストロークと第6ストロークとの距離とし、前記再
処理方法は、前後関係のある2つのストロークの距離と
文字サイズの比率が第1の閾値より小さく、且つ前記角
度差が第2の閾値より小さく、且つ前記接続角度差が第
3の閾値より小さいとき、前記2つのストロークを接続
する処理であることを特徴としている。
According to the fourth aspect of the invention, the last two points of the fifth stroke are defined as p1 and p2, the first two points of the subsequent sixth stroke are defined as p3 and p4, and they are formed by points p1 and p2. And the absolute value of the angular difference between the vector formed by the points p3 and p4 is defined as the pen-up / pen-down angular difference between the fifth stroke and the sixth stroke.
The absolute value of the angular difference between the vector formed by 2 and the vector formed by the points p2, p3 is the connection angle difference between the fifth stroke and the sixth stroke, and the distance between the points p2 and p3 is the fifth stroke. And the distance between the stroke and the character size is smaller than a first threshold, and the angle difference is smaller than a second threshold. When the connection angle difference is smaller than a third threshold value, the process is a process of connecting the two strokes.

【0010】請求項5記載の発明では、前記再処理方法
は、前後関係のある2つのストロークの角度差が、前記
第2の閾値以下の値に設定された第4の閾値より小さ
く、且つ2つのストロークの距離と文字サイズの比率
が、前記第1の閾値以上の値に設定された第5の閾値以
下のとき、前記2つのストロークを接続する処理である
ことを特徴としている。
According to the fifth aspect of the present invention, in the reprocessing method, the angular difference between two strokes having a front-rear relationship is smaller than a fourth threshold value set to a value equal to or less than the second threshold value, and 2 When the ratio between the distance of one stroke and the character size is less than or equal to a fifth threshold value set to a value equal to or greater than the first threshold value, the process is a process of connecting the two strokes.

【0011】請求項6記載の発明では、前記再処理方法
は、前後関係のある2つのストロークの距離と文字サイ
ズの比率が前記第1の閾値以下の値に設定された第6の
閾値より小さく、且つ角度差が、前記第2の閾値以上の
値に設定された第7の閾値以下のとき、前記2つのスト
ロークを接続する処理であることを特徴としている。
According to a sixth aspect of the present invention, in the reprocessing method, the ratio between the distance between two strokes and the character size which are in the context is smaller than the sixth threshold value set to a value equal to or less than the first threshold value. And, when the angle difference is less than or equal to the seventh threshold value set to a value equal to or greater than the second threshold value, the process is a process of connecting the two strokes.

【0012】[0012]

【作用】タブレット上で電子ペンを移動させることによ
って文字が入力される。オンライン文字データ入力部
は、入力文字を座標値の時系列データに変換して取り込
む。前処理部で平滑化処理、セリフ除去された入力文字
の構造は、構造解析部で解析された後、認識部に入力さ
れ、辞書に格納された文字パターンモデルとのパターン
マッチングが行われ、認識処理される。認識部において
認識拒否された文字データに対して、再処理部では2種
類のノイズ除去方法と3種類のストローク接続方法を用
いて再処理し、再処理されたデータは再び構造解析部に
渡された後、認識処理され、認識結果が出力される。こ
れにより、オンライン手書き文字の認識率を向上させる
ことが可能となる。
[Operation] Characters are input by moving the electronic pen on the tablet. The online character data input unit converts an input character into time series data of coordinate values and takes in the data. The structure of the input character that has undergone smoothing processing and serif removal by the preprocessing unit is analyzed by the structure analysis unit, then input to the recognition unit, and pattern matching is performed with the character pattern model stored in the dictionary for recognition. It is processed. The character data whose recognition is rejected by the recognition unit is reprocessed by the reprocessing unit using two types of noise removal methods and three types of stroke connection methods, and the reprocessed data is passed again to the structure analysis unit. After that, recognition processing is performed and the recognition result is output. This makes it possible to improve the recognition rate of online handwritten characters.

【0013】[0013]

【実施例】以下、本発明の一実施例を図面を用いて具体
的に説明する。図1は、本発明の実施例に係るブロック
構成図である。図において、1は、タブレット等の座標
入力部であり、透明表示盤と一体に形成されている。2
は、スタイラスペン等の電子ペンである。3は、ペンに
よってタブレット上に記入された入力文字を座標値の時
系列データ(空間的な情報と時間的な情報を含む)に変
換して取り込むオンライン文字データ入力部である。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be specifically described below with reference to the drawings. FIG. 1 is a block configuration diagram according to an embodiment of the present invention. In the figure, reference numeral 1 is a coordinate input unit such as a tablet, which is formed integrally with a transparent display board. Two
Is an electronic pen such as a stylus pen. An online character data input unit 3 converts an input character written on the tablet with a pen into time series data (including spatial information and temporal information) of coordinate values and takes in the converted data.

【0014】電子ペン2をタブレット1の表面上に接触
させながら移動させることによって、文字が入力され
る。オンライン文字データ入力部3は、タブレット1か
らの座標点の列を一定の速度でサンプリングして文字形
状を有限個の点のデータ列に変換する。また、ペン2が
タブレット1の表面上に降ろされて最初に接触すること
をペンダウンといい、接触している状態からペン2を上
げてタブレット1の表面から離すことをペンアップとい
う。そして、ペンダウンからペンアップの間にサンプリ
ングされた点列のデータをストロークといい、文字は、
一個または複数個のストロークからなる。
Characters are input by moving the electronic pen 2 while contacting the surface of the tablet 1. The online character data input unit 3 samples the string of coordinate points from the tablet 1 at a constant speed and converts the character shape into a data string of a finite number of points. Further, the pen 2 being lowered onto the surface of the tablet 1 and first contacting with it is called pen down, and the pen 2 being raised from the contact state and separated from the surface of the tablet 1 is called pen up. And the data of the point sequence sampled from pen down to pen up is called stroke, and the character is
It consists of one or more strokes.

【0015】4は、入力された手書き文字の生データに
対して、セリフ除去、平滑化などの処理を行う前処理
部、5は、前処理された手書き文字の構造を解析する構
造解析部、6は、解析された手書き文字の構造と辞書7
内のモデルとパターンマッチングを行って、手書き文字
を認識処理する認識部、7は、文字のパターンモデルが
格納された辞書、8は、認識が拒否されたデータに対し
てのみ、後述する本発明の再処理を行い、処理後のデー
タを構造解析部5または結果出力部9に渡す再処理部、
9は、認識の結果をディスプレイなどの画面またはファ
イルに出力する結果出力部である。
Reference numeral 4 denotes a preprocessing unit for performing processing such as serif removal and smoothing on the input raw data of handwritten characters, and 5 is a structure analysis unit for analyzing the structure of the preprocessed handwritten characters. 6 is the structure of the analyzed handwritten character and the dictionary 7
Of the present invention, which will be described later, only for the data for which the recognition is rejected, 7 is a dictionary in which a handwritten character is recognized by performing pattern matching with the model in FIG. A reprocessing unit that reprocesses the processed data and passes the processed data to the structure analysis unit 5 or the result output unit 9.
A result output unit 9 outputs a recognition result to a screen such as a display or a file.

【0016】認識部6において認識できなかった手書き
文字データに対して、本発明の再処理部8はその拒否原
因の分析と再処理手順の決定を総合的に管理するもので
あり、再処理の手順としては、2種類のノイズ除去方法
と3種類のストローク接続方法が適用される。
For the handwritten character data that cannot be recognized by the recognition unit 6, the reprocessing unit 8 of the present invention comprehensively manages the analysis of the cause of rejection and the determination of the reprocessing procedure. As the procedure, two types of noise removal methods and three types of stroke connection methods are applied.

【0017】図2は、文字サイズとストロークサイズの
相対関係を利用した、本実施例の第1のノイズ除去方法
を説明する図である。ここで、ストロークサイズとは、
ストロークをちょうど囲む長方形(以下、外接長方形)
の対角線の長さをいう。また、文字のサイズとは、文字
の外接長方形の対角線の長さである。
FIG. 2 is a diagram for explaining the first noise removal method of this embodiment, which utilizes the relative relationship between the character size and the stroke size. Here, the stroke size is
A rectangle that exactly encloses a stroke (hereinafter referred to as a circumscribed rectangle)
Is the length of the diagonal line. The character size is the length of the diagonal line of the circumscribed rectangle of the character.

【0018】第1のノイズ除去方法では、あるストロー
クのサイズ(stk_siz)とそのストロークが属し
ている文字のサイズ(ch_siz)の比率(stk_
ch_rt=stk_siz/ch_siz)が所定の
閾値(thr_v1=0.055)より小さい場合(s
tk_ch_rt<thr_v1)、そのストロークを
ノイズとみなして、文字から除去する。
In the first noise removal method, the ratio (stk_) of the size of a stroke (stk_siz) to the size of the character (ch_siz) to which the stroke belongs.
If ch_rt = stk_siz / ch_siz is smaller than a predetermined threshold value (thr_v1 = 0.055) (s
tk_ch_rt <thr_v1), consider the stroke as noise and remove it from the character.

【0019】図3は、文字サイズとストロークサイズと
ストローク間の距離を利用した、本実施例の第2のノイ
ズ除去方法を説明する図である。2ストローク以上の文
字において、あるストローク(stk)と他のストロー
ク(rest_stks)間の距離(stk_dis)
とは、stkの外接長方形とrest_stksの外接
長方形との重なり部分がある場合は0であり、重なり部
分がない場合、stkの点列とrest_stksの点
列の間の最短距離である。
FIG. 3 is a diagram for explaining a second noise removing method of this embodiment, which utilizes the character size, the stroke size, and the distance between strokes. In a character with two or more strokes, the distance (stk_dis) between one stroke (stk) and another stroke (rest_stks)
Is 0 when there is an overlapping portion of the circumscribing rectangle of stk and the circumscribing rectangle of rest_stks, and is the shortest distance between the point sequence of stk and the point sequence of rest_stks when there is no overlapping portion.

【0020】第2のノイズ除去方法では、あるストロー
クについて、ストロークのサイズとストローク間の距離
の比率(stk_dis_rt=stk_siz/st
k_dis)が所定の閾値(thr_v2=0.05
5)より小さく(stk_dis_rt<thr_v
2)、且つストローク間の距離と文字サイズの比率(d
is_dim_rt=stk_dis/ch_siz)
が所定の閾値(thr_v3=0.700)より大きい
(dis_dim_rt>thr_v3)場合、そのス
トロークをノイズとみなして、文字から除去する。
In the second noise removal method, for a certain stroke, the ratio of the size of the stroke and the distance between the strokes (stk_dis_rt = stk_siz / st).
k_dis) is a predetermined threshold value (thr_v2 = 0.05)
5) smaller than (stk_dis_rt <thr_v
2) and the ratio of the distance between strokes and the character size (d
is_dim_rt = stk_dis / ch_siz)
Is larger than a predetermined threshold value (thr_v3 = 0.700) (dis_dim_rt> thr_v3), the stroke is regarded as noise and removed from the character.

【0021】図4は、文字のオンライン入力情報、文字
サイズ、ストローク間の距離、ストローク間の角度を利
用した、本実施例の第1のストローク接続方法を説明す
る図である。文字のオンライン入力情報とは、前述した
ようにストロークを書く時のペンダウン、ペンアップ情
報(つまり、ストローク座標の時系列における最初のデ
ータがペンダウンの場所を示し、最後のデータがペンア
ップの場所を示す)および文字を書くときの筆順情報
(各ストロークの前後順序)である。
FIG. 4 is a diagram for explaining the first stroke connection method of the present embodiment using the online input information of characters, the character size, the distance between strokes, and the angle between strokes. Online input information of characters is the pen-down and pen-up information when writing a stroke as described above (that is, the first data in the time series of stroke coordinates indicates the pen-down location, and the last data indicates the pen-up location. (Shown) and stroke order information (the order before and after each stroke) when writing a character.

【0022】あるストローク(stk1)の最後の2点
をp1,p2とし、後続のストローク(stk2)の最
初の2点をp3,p4とする。stk1とstk2との
ペンアップ/ペンダウン角度差(ang1)とは、ベク
トル(p1,p2)とベクトル(p3,p4)の角度差
の絶対値である。また、stk1とstk2との接続角
度差とは、ベクトル(p1,p2)とベクトル(p2,
p3)の角度差の絶対値である。stk1とstk2と
の距離(stk_dis_1_2)とは、p2とp3間
の距離である。
The last two points of a certain stroke (stk1) are designated as p1 and p2, and the first two points of the subsequent stroke (stk2) are designated as p3 and p4. The pen-up / pen-down angle difference (ang1) between stk1 and stk2 is the absolute value of the angle difference between the vector (p1, p2) and the vector (p3, p4). Further, the connection angle difference between stk1 and stk2 means the vector (p1, p2) and the vector (p2,
It is the absolute value of the angle difference of p3). The distance (stk_dis_1_2) between stk1 and stk2 is the distance between p2 and p3.

【0023】本実施例の第1のストローク接続方法で
は、前後関係のある2つのストロークの距離と文字サイ
ズの比率(dis_1_2_dim_rt=stk_d
is_1_2/ch_siz)が所定の閾値(thr_
v4=0.2)より小さく、且つang1が所定の閾値
(thr_v5=60度)より小さく、且つang2が
所定の閾値(thr_v6=60度)より小さい場合、
これら2つのストロークを接続する。
In the first stroke connection method of the present embodiment, the ratio of the distance between two strokes and the character size having a front-back relationship (dis_1_2_dim_rt = stk_d).
is_1_2 / ch_siz is a predetermined threshold value (thr_
v4 = 0.2), ang1 is smaller than a predetermined threshold (thr_v5 = 60 degrees), and ang2 is smaller than a predetermined threshold (thr_v6 = 60 degrees),
Connect these two strokes.

【0024】図5は、ほぼ同じ進行方向のストロークを
接続する、本実施例の第2のストローク接続方法を説明
する図である。前後関係のあるストロークstk1とs
tk2のang1が所定の閾値(thr_v7=15
度)より小さく、且つdis_1_2_dim_rtが
所定の閾値(thr_v8=0.4)以下の場合、これ
ら2つのストロークを接続する。但し、第2のストロー
ク接続方法と第1のストローク接続方法との相違は、a
ng1の条件を厳しくし(thr_v7<thr_v
5)、dis_1_2_dim_rtの条件を緩和した
(thr_v8>thr_v4)点にある。
FIG. 5 is a diagram for explaining a second stroke connecting method of the present embodiment, which connects strokes in substantially the same traveling direction. Strokes stk1 and s that are related to each other
ang1 of tk2 is a predetermined threshold value (thr_v7 = 15)
2) and dis_1_2_dim_rt is less than or equal to a predetermined threshold (thr_v8 = 0.4), these two strokes are connected. However, the difference between the second stroke connection method and the first stroke connection method is that
stricter conditions for ng1 (thr_v7 <thr_v
5), the condition of dis_1_2_dim_rt is relaxed (thr_v8> thr_v4).

【0025】図6は、極近距離のストロークを接続す
る、本実施例の第3のストローク接続方法を説明する図
である。前後関係のあるストロークstk1とstk2
のdis_1_2_dim_rtが所定の閾値(thr
_v9=0.1)より小さく、且つang1が所定の閾
値(thr_v10=90度)以下の場合、これら2つ
のストロークを接続する。但し、第3のストローク接続
方法と第1のストローク接続方法との相違は、dis_
1_2_dim_rtの条件を厳しくし(thr_v9
<thr_v4)、ang1の条件を緩和した(thr
_v10>thr_v5)点にある。
FIG. 6 is a diagram for explaining a third stroke connecting method of the present embodiment for connecting strokes at extremely short distances. Strokes stk1 and stk2 that are related to each other
Dis_1_2_dim_rt is a predetermined threshold value (thr
If less than _v9 = 0.1) and ang1 is less than or equal to a predetermined threshold value (thr_v10 = 90 degrees), these two strokes are connected. However, the difference between the third stroke connection method and the first stroke connection method is dis_
Strict conditions for 1_2_dim_rt (thr_v9
<Thr_v4), the condition of ang1 is relaxed (thr_v4)
_V10> thr_v5).

【0026】図7は、本実施例の再処理部8の構成を示
し、拒否データの拒否原因を解析し、多段階の再処理手
順を決定し、最適な再処理を行う。図7において、拒否
データ保存バッファ配列26には再処理する前の認識拒
否データが保存される。再処理手法テーブル24には、
再処理のために各種の手法が登録される。この再処理手
法としては、前述した第1、第2のノイズ除去方法、第
1乃至第3のストローク接続方法があり、さらに他の手
法を追加することもできる。そして、再処理手順とは、
これらの再処理手法の一部または全部をどのような順番
で拒否データに適用するかを示すものである。
FIG. 7 shows the configuration of the reprocessing unit 8 of this embodiment, which analyzes the cause of rejection of reject data, determines a multi-step reprocessing procedure, and performs optimum reprocessing. In FIG. 7, the refusal data storage buffer array 26 stores the recognition refusal data before reprocessing. In the reprocessing method table 24,
Various methods are registered for reprocessing. As the reprocessing method, there are the above-described first and second noise removal methods and the first to third stroke connection methods, and other methods can be added. And the reprocessing procedure is
It shows in what order some or all of these reprocessing techniques are applied to the reject data.

【0027】再処理履歴表23には拒否データ保存バッ
ファ配列26の番号、再処理手順が記録される。拒否原
因解析部21では、拒否データについて、辞書モデルと
のマッチング状況、ノイズ状況、ストローク接続状況を
調べ、拒否の原因を解析する。再処理手順決定部22で
は、拒否原因と再処理履歴表23を参照し、再処理する
か否かを決める。再処理する場合、再処理の手順を決定
し、拒否データを拒否データ保存バッファ配列26に書
き込み、その番号と再処理の手順を再処理履歴表23に
記録する。再処理実行部25は、再処理手順に従って、
拒否データを再処理し、その結果を図1の構造解析部5
にわたす。
The reprocessing history table 23 records the number of the reject data storage buffer array 26 and the reprocessing procedure. The refusal cause analysis unit 21 examines the refusal data for the matching status with the dictionary model, the noise status, and the stroke connection status, and analyzes the cause of the refusal. The reprocessing procedure determination unit 22 refers to the cause of refusal and the reprocessing history table 23 to determine whether or not to reprocess. In the case of reprocessing, the reprocessing procedure is determined, the rejection data is written in the rejection data storage buffer array 26, and the number and the reprocessing procedure are recorded in the reprocessing history table 23. The reprocessing execution unit 25 follows the reprocessing procedure
The refusal data is reprocessed, and the result is the structural analysis unit 5 of FIG.
Hand over.

【0028】例えば、再処理手法テーブル24に第1、
第2のノイズ除去方法(NE1,NE2)、第1乃至第
3のストローク接続方法(BC1,BC2,BC3)が
登録されていて、拒否データ(ch_rj_0)が入力
したとする。また、この時点では、再処理履歴表23に
は何も書かれていないものとする。
For example, in the reprocessing method table 24, the first,
It is assumed that the second noise removal method (NE1, NE2) and the first to third stroke connection methods (BC1, BC2, BC3) are registered and the rejection data (ch_rj_0) is input. At this point, nothing is written in the reprocessing history table 23.

【0029】再処理手順決定部22は、拒否原因が解析
された拒否データ(ch_rj_0)について、その再
処理の手法を決める。例えば、テーブル24に登録され
たNE1、次いでBC1の順番で適用することを決定す
る。拒否データ(ch_rj_0)は、拒否データ保存
バッファ配列26の0番に記録される。
The reprocessing procedure determination unit 22 determines a reprocessing method for the rejection data (ch_rj_0) whose rejection cause is analyzed. For example, it is determined to apply in the order of NE1 registered in the table 24 and then BC1. The refusal data (ch_rj_0) is recorded at 0 in the refusal data storage buffer array 26.

【0030】再処理実行部25は、拒否データ(ch_
rj_0)に対して、NE1を適用してノイズを除去
し、次いでBC1を適用してストロークを接続し、構造
解析部にデータをわたすとともに、再処理履歴表23に
は、拒否データ保存バッファ配列26の0番データに対
して、NE1−>BC1の手順で処理したことを示す、
0;NE1−>BC1が記録される。
The reprocessing execution unit 25 uses the rejection data (ch_
For rj_0), NE1 is applied to remove noise, then BC1 is applied to connect strokes, data is passed to the structural analysis unit, and in the reprocessing history table 23, the reject data storage buffer array 26 No. 0 data is processed in the procedure of NE1-> BC1.
0; NE1-> BC1 is recorded.

【0031】この再処理においても、認識が拒否された
ときは、再処理手順決定部22は、拒否原因の解析結果
と再処理履歴表23の参照(0番データのNE1−>B
C1を参照)に基づいて、例えば、再処理の手順をNE
2−>BC3に決定して、再処理を実行する。また、再
処理履歴表23には、0;NE1−>BC1,NE2−
>BC3が記録される。そして、条件を変えて認識処理
が行われる。
Even in this reprocessing, when the recognition is rejected, the reprocessing procedure determination unit 22 refers to the analysis result of the rejection cause and the reprocessing history table 23 (NE1-> B of the 0th data).
(See C1), for example, the procedure of reprocessing is NE
2-> BC3 is determined and reprocessing is executed. Further, in the reprocessing history table 23, 0; NE1-> BC1, NE2-
> BC3 is recorded. Then, the recognition process is performed under different conditions.

【0032】[0032]

【発明の効果】以上、説明したように、請求項1記載の
発明によれば、オンライン手書き文字の認識拒否データ
について、その時間情報と空間情報を用いて認識拒否の
原因を解析し、最適な再処理手順を決めてノイズ除去、
ストローク接続などの再処理を行っているので、オンラ
イン手書き文字の認識率を向上させることができる。
As described above, according to the invention described in claim 1, with respect to the recognition refusal data of the online handwritten character, the cause of the recognition refusal is analyzed by using the time information and the spatial information, and the optimum decision is made. Decide the reprocessing procedure to remove noise,
Since reprocessing such as stroke connection is performed, the recognition rate of online handwritten characters can be improved.

【0033】請求項2記載の発明によれば、文字サイズ
とストロークサイズの相対関係を用いたノイズ除去方法
を採っているので、最適な再処理が行われ、認識率を向
上させることができる。
According to the second aspect of the invention, since the noise removing method using the relative relationship between the character size and the stroke size is adopted, optimum reprocessing can be performed and the recognition rate can be improved.

【0034】請求項3記載の発明によれば、文字サイズ
とストロークサイズの相対関係、更にはストローク間の
距離を考慮したノイズ除去方法を採っているので、更に
認識率を向上させることが可能となる。
According to the third aspect of the present invention, since the noise removing method considering the relative relationship between the character size and the stroke size and the distance between the strokes is adopted, it is possible to further improve the recognition rate. Become.

【0035】請求項4記載の発明によれば、オンライン
入力文字情報、文字サイズ、ストローク間の距離、スト
ローク間の角度を用いたストローク接続方法であるの
で、切れたストロークが接続され、再処理されたストロ
ーク接続後の文字に対して認識処理され、その結果、認
識率が向上する。
According to the invention of claim 4, since it is a stroke connecting method using online input character information, character size, distance between strokes, and angle between strokes, broken strokes are connected and reprocessed. The character after the stroke is connected is recognized, and as a result, the recognition rate is improved.

【0036】請求項5記載の発明によれば、接続角度の
条件を請求項4に記載の方法よりも厳しくし、ほぼ同じ
進行方向の切れたストロークを接続しているので、再処
理後の認識率が更に向上する。
According to the invention described in claim 5, since the condition of the connection angle is made stricter than that of the method described in claim 4, and the broken strokes in substantially the same traveling direction are connected, the recognition after the reprocessing is performed. The rate is further improved.

【0037】請求項6記載の発明によれば、ストローク
間の距離条件を請求項4に記載の方法よりも厳しくし、
極近い距離にあるストロークを接続しているので、再処
理後の認識率が更に向上する。
According to the invention of claim 6, the distance condition between strokes is made stricter than that of the method of claim 4,
Since the strokes that are extremely close to each other are connected, the recognition rate after reprocessing is further improved.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の実施例に係るブロック構成図である。FIG. 1 is a block diagram according to an embodiment of the present invention.

【図2】本実施例の第1のノイズ除去方法を説明する図
である。
FIG. 2 is a diagram illustrating a first noise removal method of this embodiment.

【図3】本実施例の第2のノイズ除去方法を説明する図
である。
FIG. 3 is a diagram illustrating a second noise removal method of the present embodiment.

【図4】本実施例の第1のストローク接続方法を説明す
る図である。
FIG. 4 is a diagram illustrating a first stroke connection method of the present embodiment.

【図5】本実施例の第2のストローク接続方法を説明す
る図である。
FIG. 5 is a diagram illustrating a second stroke connection method of the present embodiment.

【図6】本実施例の第3のストローク接続方法を説明す
る図である。
FIG. 6 is a diagram illustrating a third stroke connection method of the present embodiment.

【図7】本実施例の再処理部の構成を示す図である。FIG. 7 is a diagram illustrating a configuration of a reprocessing unit according to the present exemplary embodiment.

【符号の説明】[Explanation of symbols]

1 タブレット 2 電子ペン 3 オンライン文字データ入力部 4 前処理部 5 構造解析部 6 認識部 7 辞書 8 再処理部 9 結果出力部 1 tablet 2 electronic pen 3 online character data input unit 4 preprocessing unit 5 structural analysis unit 6 recognition unit 7 dictionary 8 reprocessing unit 9 result output unit

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 オンライン手書き文字認識装置における
認識拒否文字の再処理方法において、認識拒否された文
字データの拒否原因を解析し、該拒否原因と、該拒否デ
ータに対して既に適用された再処理の手順が書き込まれ
た表とを参照して、再処理を行うか否かを決め、再処理
を行うとき、登録された複数の再処理方法を適用して再
処理を実行し、適用された再処理方法を前記表に書き込
むことを特徴とするオンライン手書き文字認識方法。
1. A method of reprocessing a recognition rejected character in an online handwritten character recognition device, analyzing the cause of rejection of character data of which recognition is rejected, and the cause of rejection and the reprocessing already applied to the rejected data. Refer to the table in which the procedure is written and decide whether or not to reprocess, and when reprocessing, apply the registered reprocessing methods, execute the reprocessing, and apply. An online handwritten character recognition method, characterized in that the reprocessing method is written in the table.
【請求項2】 文字を構成する一乃至複数のストローク
であり、該ストロークを囲む長方形の対角線の長さをス
トロークサイズとし、該文字を囲む長方形の対角線の長
さを文字サイズとし、前記再処理方法は、第1のストロ
ークサイズと該第1のストロークが属する文字のサイズ
との比率が所定の閾値より小さいとき、前記第1のスト
ロークをノイズと判定して、前記第1のストロークが属
する文字から第1のストロークを除去する処理であるこ
とを特徴とする請求項1記載のオンライン手書き文字認
識方法。
2. The reprocessing, comprising one or a plurality of strokes forming a character, wherein a length of a diagonal line of a rectangle surrounding the stroke is a stroke size, and a length of a diagonal line of a rectangle surrounding the character is a character size. In the method, when the ratio of the first stroke size to the size of the character to which the first stroke belongs is smaller than a predetermined threshold, the first stroke is determined to be noise, and the character to which the first stroke belongs. The online handwritten character recognition method according to claim 1, wherein the first stroke is removed from the first stroke.
【請求項3】 2ストローク以上の文字であり、第2の
ストロークを囲む長方形と第3のストロークを囲む長方
形との重なり部分がないとき、該第2のストロークの点
列と該第3のストロークの点列の間の最短距離を、第
2、第3のストローク間の距離とし、前記再処理方法
は、第4のストロークのストロークサイズとストローク
間距離の比率が所定の閾値より小さく、且つ該ストロー
ク間距離と文字サイズの比率が所定の閾値より大きいと
き、前記第4のストロークをノイズと判定して、前記第
4のストロークが属する文字から第4のストロークを除
去する処理であることを特徴とする請求項1記載のオン
ライン手書き文字認識方法。
3. A character string having two or more strokes, and when there is no overlapping portion of a rectangle surrounding the second stroke and a rectangle surrounding the third stroke, the point sequence of the second stroke and the third stroke. The shortest distance between the point sequences is set as the distance between the second and third strokes, and in the reprocessing method, the ratio of the stroke size of the fourth stroke to the stroke distance is smaller than a predetermined threshold value, and When the ratio of the distance between strokes and the character size is larger than a predetermined threshold value, the fourth stroke is determined to be noise, and the fourth stroke is removed from the character to which the fourth stroke belongs. The online handwritten character recognition method according to claim 1.
【請求項4】 第5のストロークの最後の2点をp1,
p2とし、後続する第6のストロークの最初の2点をp
3,p4とし、点p1,p2で形成されるベクトルと点
p3,p4で形成されるベクトルの角度差の絶対値を、
第5ストロークと第6ストロークとのペンアップ/ペン
ダウン角度差とし、点p1,p2で形成されるベクトル
と点p2,p3で形成されるベクトルとの角度差の絶対
値を、第5ストロークと第6ストロークとの接続角度差
とし、点p2とp3間の距離を第5ストロークと第6ス
トロークとの距離とし、前記再処理方法は、前後関係の
ある2つのストロークの距離と文字サイズの比率が第1
の閾値より小さく、且つ前記角度差が第2の閾値より小
さく、且つ前記接続角度差が第3の閾値より小さいと
き、前記2つのストロークを接続する処理であることを
特徴とする請求項1記載のオンライン手書き文字認識方
法。
4. The last two points of the fifth stroke are p1,
p2, and the first two points of the subsequent sixth stroke are p
3, p4, the absolute value of the angular difference between the vector formed by the points p1 and p2 and the vector formed by the points p3 and p4 is
The pen-up / pen-down angle difference between the fifth stroke and the sixth stroke is defined as the absolute value of the angle difference between the vector formed by the points p1 and p2 and the vector formed by the points p2 and p3. The connection angle difference with 6 strokes, the distance between points p2 and p3 is the distance between the 5th stroke and the 6th stroke, and in the reprocessing method, the distance between the two strokes in the front-back relationship and the character size ratio are First
2. When the angle difference is smaller than the threshold value, the angle difference is smaller than the second threshold value, and the connection angle difference is smaller than the third threshold value, the process is a process of connecting the two strokes. Online handwriting recognition method.
【請求項5】 前記再処理方法は、前後関係のある2つ
のストロークの角度差が、前記第2の閾値以下の値に設
定された第4の閾値より小さく、且つ2つのストローク
の距離と文字サイズの比率が、前記第1の閾値以上の値
に設定された第5の閾値以下のとき、前記2つのストロ
ークを接続する処理であることを特徴とする請求項4記
載のオンライン手書き文字認識方法。
5. The reprocessing method is such that an angular difference between two strokes having a front-back relationship is smaller than a fourth threshold value set to a value equal to or less than the second threshold value, and a distance and a character between the two strokes. The online handwritten character recognition method according to claim 4, wherein when the size ratio is less than or equal to a fifth threshold value set to a value greater than or equal to the first threshold value, the process is a process of connecting the two strokes. .
【請求項6】 前記再処理方法は、前後関係のある2つ
のストロークの距離と文字サイズの比率が、前記第1の
閾値以下の値に設定された第6の閾値より小さく、且つ
角度差が、前記第2の閾値以上の値に設定された第7の
閾値以下のとき、前記2つのストロークを接続する処理
であることを特徴とする請求項4記載のオンライン手書
き文字認識方法。
6. The reprocessing method, wherein the ratio of the distance and the character size of two strokes having a front-rear relationship is smaller than a sixth threshold value set to a value equal to or less than the first threshold value, and an angle difference is 5. The online handwritten character recognition method according to claim 4, wherein when the value is equal to or less than a seventh threshold value set to a value equal to or higher than the second threshold value, the process is a process of connecting the two strokes.
JP4201195A 1992-07-28 1992-07-28 On-line handwritten character recognizing method Pending JPH0652363A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4201195A JPH0652363A (en) 1992-07-28 1992-07-28 On-line handwritten character recognizing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4201195A JPH0652363A (en) 1992-07-28 1992-07-28 On-line handwritten character recognizing method

Publications (1)

Publication Number Publication Date
JPH0652363A true JPH0652363A (en) 1994-02-25

Family

ID=16436924

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4201195A Pending JPH0652363A (en) 1992-07-28 1992-07-28 On-line handwritten character recognizing method

Country Status (1)

Country Link
JP (1) JPH0652363A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6479914B2 (en) 2000-01-28 2002-11-12 Matsushita Electric Industrial Vibration motor having an eccentric weight and device including the same motor
JP2003008899A (en) * 2001-06-19 2003-01-10 Fuji Xerox Co Ltd Image processor
JP2007334420A (en) * 2006-06-12 2007-12-27 Dainippon Printing Co Ltd Processor and program
US9792495B2 (en) 2015-04-03 2017-10-17 Fuji Xerox Co., Ltd. Character recognition apparatus, character recognition processing system, and non-transitory computer readable medium

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6479914B2 (en) 2000-01-28 2002-11-12 Matsushita Electric Industrial Vibration motor having an eccentric weight and device including the same motor
JP2003008899A (en) * 2001-06-19 2003-01-10 Fuji Xerox Co Ltd Image processor
JP2007334420A (en) * 2006-06-12 2007-12-27 Dainippon Printing Co Ltd Processor and program
US9792495B2 (en) 2015-04-03 2017-10-17 Fuji Xerox Co., Ltd. Character recognition apparatus, character recognition processing system, and non-transitory computer readable medium

Similar Documents

Publication Publication Date Title
CN107885327B (en) Fingertip detection method based on Kinect depth information
CN109685065B (en) Layout analysis method and system for automatically classifying test paper contents
CN111260568B (en) Peak binarization background noise removing method based on multi-discriminator countermeasure network
JP2021527256A (en) Systems and methods for detecting and classifying patterns in images with a vision system
Rahim et al. Hand gesture recognition based on optimal segmentation in human-computer interaction
Bai et al. Chinese image text recognition on grayscale pixels
Bataineh An iterative thinning algorithm for binary images based on sequential and parallel approaches
Pradhan et al. A hand gesture recognition using feature extraction
JP2881866B2 (en) Handwritten character recognition method and apparatus
Xiao et al. Trajectories-based motion neighborhood feature for human action recognition
JPH0652363A (en) On-line handwritten character recognizing method
EP3711027A1 (en) System and method for drawing beautification
CN111651038A (en) Gesture recognition control method based on ToF and control system thereof
CN115546105A (en) Tire pattern detection method and device, readable storage medium and terminal equipment
CN108830166B (en) Real-time bus passenger flow volume statistical method
Jha et al. Real Time Hand Gesture Recognition for Robotic Control
CN111639573A (en) Gesture recognition method based on ORB algorithm, storage medium and electronic equipment
Soni et al. To Propose an improvement in Zhang-Suen algorithm for image thinning in image processing
Javed et al. Background and punch-hole noise removal from handwritten urdu text
AU2019219714B2 (en) Systems and methods for performing hand segmentation
Aruleba et al. Pre-Processing and Feature Extraction Technique for Hand-drawn Finite Automata Recognition
Maurya et al. Real time hand segmentation on frugal headmounted device for gestural interface
JP2844789B2 (en) Character recognition method and character recognition device
Omkar et al. Sign Language Recognition using Thinning algorithm
Jayarathna et al. New segmentation algorithm for offline handwritten connected character segmentation

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 7

Free format text: PAYMENT UNTIL: 20070804

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080804

Year of fee payment: 8

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080804

Year of fee payment: 8

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090804

Year of fee payment: 9

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090804

Year of fee payment: 9

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100804

Year of fee payment: 10

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100804

Year of fee payment: 10

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110804

Year of fee payment: 11

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110804

Year of fee payment: 11

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 12

Free format text: PAYMENT UNTIL: 20120804

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130804

Year of fee payment: 13

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130804

Year of fee payment: 13

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 13

Free format text: PAYMENT UNTIL: 20130804

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350