JP2001256437A - 自由な字画筆順および連筆字画に対応したオンライン手書き漢字認識装置 - Google Patents

自由な字画筆順および連筆字画に対応したオンライン手書き漢字認識装置

Info

Publication number
JP2001256437A
JP2001256437A JP2000065095A JP2000065095A JP2001256437A JP 2001256437 A JP2001256437 A JP 2001256437A JP 2000065095 A JP2000065095 A JP 2000065095A JP 2000065095 A JP2000065095 A JP 2000065095A JP 2001256437 A JP2001256437 A JP 2001256437A
Authority
JP
Japan
Prior art keywords
segment
segments
character
stroke
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000065095A
Other languages
English (en)
Inventor
Okubun Cho
憶文 張
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2000065095A priority Critical patent/JP2001256437A/ja
Publication of JP2001256437A publication Critical patent/JP2001256437A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 自由な字画筆順および連筆字画に対応した手
書き漢字認識装置を提供する。 【解決手段】 手書き漢字認識装置は、セグメント構成
部と、セグメントフィルタリング部と、ソート部と、比
較認識部とを含む。認識装置は、座標点および入力され
た手書き漢字の各字画の各セグメントの方向を利用して
セグメント間の空間的相対関係を判定し、全てのセグメ
ントを再構成する。その後隣接するセグメントに対する
連筆方向および各セグメントの位置の適切さを鑑み、不
適切なセグメントを除去する。字画筆順自由に対する問
題の解決策の提供とは別に、連筆字画による干渉の問題
は、不適切なセグメントの除去を経ると克服できる。さ
らにセグメントは標準的な人間の字画の筆順で構成され
ているので、比較の際に採用される字形特徴データベー
スは比較的少数のテンプレートを格納すればすむ。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、自由な字画筆順お
よび連筆字画に対応した手書き漢字認識装置に関する。
【0002】
【従来の技術】オンライン漢字認識において常に存在す
る2つの主要な問題は、字画筆順および連筆字画を自由
にすることである。いわゆる「字画筆順の自由」とは、
文字の入力時に、特定の字画の筆順に制限されることな
くユーザが任意の筆順を用いる自由をいう。他方、書き
方の癖または速記に起因して、ユーザは連筆した字画で
文字を書くことがある。連筆する字画を自由に認めるこ
とにより、認識能力に影響を及ぼすことなく、連筆字画
で文字を書くことができる。一般的な規則として、字画
筆順の自由についての問題を解決する最も頻繁に採用さ
れる方法は、各字画のカテゴリーを判定し、そして字画
の筆順を再構成することである。しかし、仮に文字が連
筆した字画で書かれている場合には、正確に字画のカテ
ゴリーを判定することが困難であり、そのため正確に字
画の筆順を構成できない。したがって字画を連筆する自
由は、ある意味、字画の筆順を自由にすることについて
の問題に対する予防的解決策になる。
【0003】「入力字画筆順が自由な漢字形状認識シス
テム」と題された、台湾特許公報第187786号に開
示された発明の主要な特徴は、入力された手書き文字の
字画のカテゴリーを認識した後、字画が再構成され、字
画の位置関係が計算される。字画の再構成の間、入力さ
れた文字の構造は、同一の字画数を持つ参照文字につい
ての分解手順に基づいて分解される。これはすなわち入
力された文字の形状を、参照文字の人間の字画筆順に再
構成することである。最後に、入力された文字の形状の
特徴および参照文字の形状の特徴の間で、字画列の比較
が行われる。最小累積誤差値を持つものが、認識結果と
して出力される。図14は、従来の技術における漢字形
状認識システムのブロック図である。漢字形状認識シス
テムは、字画タイプ認識部23と、字画筆順再構成部2
5と、字画間相対位置計算部26と、字画特徴列比較部
27と、基本字画データベース32と、文字形状構造分
解手順データベース33と、字形データベース34と、
文字データベース35と、類似文字形状データベース3
6を含む。字画タイプ認識部23は、各字画の特徴点を
用いて字画特徴値を獲得する。字画特徴値は、字画デー
タベースに格納されている基本字画特徴値と比較され、
字画タイプ認識結果を獲得する。字画筆順再構成部25
は、字形構造分解手順データベースに格納された同一字
画数の参照文字についての分解手順に基づいて字画の代
表点の空間的な関係を利用することによって、構造分解
を行い、参照文字の人間の字画筆順に再構成する。字画
間相対位置計算部26は、手書き文字の隣接する字画間
の方向的関係を計算する。字画特徴列比較部27は、入
力された文字形状の字画特徴および参照文字形状の字画
特徴の間で1対1対応の比較を行い、それにより詳細識
別部28は認識結果を判定する。基本字画データベース
32は、基本字画の特徴値を格納する。文字形状構造分
解手順データベース33は、各文字形状の構造分解手順
データを表す階層構造を用いる。構造分解手順データ
は、ステップ数、字画代表点、検査法、抽出字画の数お
よび字形構造分解手順のインデックスとして作用する字
形コードを含む。字形データベース34は、参照文字形
状の字形の字画特徴を格納する。字形データベース34
は、字画数、人間の字画筆順、字画タイプおよび字画間
の相対位置関係を含む。文字データベース35は、参照
文字の字画特徴を格納する。文字データベース35は、
字画数、人間の字画筆順、字画タイプおよび字画間の相
対位置関係を含む。類似文字形状データベース36は、
候補文字が、ある類似文字グループに属する場合、詳細
に識別するために類似文字形状の基本的特徴を格納す
る。
【0004】データベースの表示方法の観点から、上述
の先行する漢字形状認識システムは階層表示を利用し
て、文字形状構造分解手順を表現する。入力された文字
形状は、固定された人間の字画筆順へ再構成するため
に、参照文字の構造分解手順に基づいて字画へ分解され
る。これは、先行する発明の主要な目的である。加え
て、先行する発明は、認識の対象として5401個の最
も頻繁に用いられる漢字を採用し、認識率は96.9%
である。
【0005】
【発明が解決しようとする課題】上述の、「入力字画筆
順が自由な漢字形状認識システム」と題された台湾特許
公報第187786号に開示された発明には、以下の欠
点がある。
【0006】1.正確に連筆字画文字の字画カテゴリー
を認識することが困難であり、そのため、字画の再構成
後の認識結果は満足のいくものにはならない。
【0007】2.同一の字画数の参照文字についての分
解手順を用いると、入力された文字に関してあらゆる種
類の構造分解を行い、字画の筆順を再構成するのに時間
を費やさなければならない。
【0008】本発明の目的はオンライン手書き漢字認識
装置を提供することである。
【0009】
【課題を解決するための手段】上述した問題を解決する
ために、本発明は自由な字画筆順および連筆字画に対応
した手書き漢字認識装置を提供する。手書き文字のセグ
メントは再構成され、字画筆順を自由にするための問題
を解決し、また不適切なセグメントは削除され、連筆字
画を自由にするための問題を解決する。自由な字画筆順
および連筆字画に対応した手書き漢字認識装置は、ディ
ジタイジングボードおよびペンから形成された入力部
と、データを一時的に格納するバッファ領域と、出力部
を有する自由な字画筆順および連筆字画に対応した手書
き漢字認識装置であって、手書き漢字認識装置は、認識
可能な全ての漢字の字形の構造関係を記録する論理関係
記述部であって、前記漢字は上−下、左−右、上蓋、半
蓋、全蓋および繞関係を持つ論理関係記述部と、字画数
と、セグメント数と、漢字字画のペンダウンセグメント
間の中間ペンアップセグメント数と、前記字画それぞれ
のセグメント数と、セグメント方向シーケンスと、特別
に記述された特徴と、類似文字とを格納する字形特徴デ
ータベースであって、前記セグメント方向シーケンス
は、前記ペンダウンセグメント間の中間ペンアップセグ
メントの方向を含む字形特徴データベースと、前記入力
部により入力された手書き文字の正規化処理および細線
化処理を行い、過剰な座標点を削除した後、前記字画の
長さと前記字画の間の交差関係とを含む特徴を抽出し、
全ての字画の全てのセグメントと前記セグメントの方向
とを45度ずつ角度が異なる8方向に応じて抽出して前
記バッファ領域に格納する前処理部と、前記前処理部に
より抽出された各セグメントの座標点と方向とに応じ
て、前記セグメント間の空間的相対関係を判定し、隣接
しかつ交差するセグメントに対して上−下、左−右、左
上−右下、および左下−右上、および水平−垂直の規則
にしたがって、全てのセグメントの筆順を再構成するセ
グメント構成部と、前記セグメント構成部により再構成
されたセグメントのシーケンスにしたがって前記セグメ
ント1つごとの適切さを検査するセグメントフィルタリ
ング部であって、あるセグメントが他のセグメントと連
筆関係にあると判断されると、前記連筆関係にあるセグ
メントの方向および位置の特徴に基づいて、前記セグメ
ントが連筆関係にあるセグメントに対し適切な連筆セグ
メントを構成するか否かを判定し、適切でなければ連筆
関係にあるセグメントを削除し、全てのセグメントを検
査すると、残存するセグメントを完全に結合し、セグメ
ントのペンダウン方向と、ペンダウンセグメント間のペ
ンアップ中間セグメントの方向とを再び抽出し、バッフ
ァ領域へ格納するセグメントの総数を計算するセグメン
トフィルタリング部と、前記字形特徴データベースにお
いて、前記字形のセグメントの総数が、入力された前記
文字のセグメントの総数と比較および認識のための基準
値として機能する適当な閾値とを加えた値よりも小さい
字形を探し、前記セグメントフィルタリング部により得
られた前記セグメント数を特徴として用いて分類を行う
ソート部と、動的比較法を用いて、および前記字形特徴
データベースを参照して、前記ソート部により得られた
字形と、セグメントフィルタリングにより得られた前記
文字の特徴を比較し、類似字形を見つけ出し、前記論理
関係記述部から前記類似字形を初期位置として有する文
字を調べ、前記文字の後ろ半分の字形を入力された文字
の残存するセグメントと比較し、それらが類似している
かを判定し、それにより比較認識結果を獲得する比較認
識部と、前記字形特徴データベースへの参照を行って、
前記比較認識部により得られた候補文字に類似する文字
を見つけ出し、前記候補文字および前記類似する文字を
出力する後処理部とを備えている。
【0010】前に述べた構成から、本発明の自由な字画
筆順および連筆字画に対応した手書き漢字認識装置で
は、入力された文字はまず、前処理される。そしてセグ
メント構成部は、入力された手書き文字の各セグメント
の座標点と方向を用いて、セグメント間の空間的相対関
係を判定する。そして、空間的相対関係にしたがって全
てのセグメントが再構成されると、それにより字画の筆
順により制限されることなくユーザは文字を書くことが
できる。セグメントフィルタリング部は、再構成された
セグメントとその隣接するセグメントの連筆方向および
位置に基づいて各セグメントの適切さを判定し、適切で
ないセグメントを除去する。字画筆順を自由にする問題
を解決するのに加えて、字画筆順を自由にできることに
よって、適切でないセグメントを削除することから連筆
セグメントによって生じる矛盾する問題にも取り組むこ
とができる。次にソート部は、入力された文字のセグメ
ント数に基づいて参照字形の範囲を見つけることがで
き、比較認識部は、動的比較法を用いて文字の特徴を比
較し、候補文字を見つけ出す。最後に、後処理部は候補
文字に類似する文字の位置付けをし、それらを出力す
る。本発明のシステムは、比較および認識段階に入る前
にセグメントを標準的な人間の字画筆順に再構成するの
で、比較のための字形特徴データベースは小規模のテン
プレートを格納するだけで足り、それによりシステムの
記憶空間およびメモリ空間を削減できる。
【0011】
【発明の実施の形態】本発明の他の特徴および利点が、
添付の図面を参照して、以下の好ましい実施の形態の詳
細な説明において明らかになるであろう。
【0012】図1は、本発明による、自由な字画筆順お
よび連筆字画に対応したオンライン手書き漢字認識装置
の好ましい実施の形態のブロック図である。入力部10
0は、例えば、ディジタイジングボードおよびペンから
なり、ユーザがオンライン文字書き込みをできるよう設
けられる。前処理部200は、ユーザにより入力される
手書き文字の正規化および細線化処理を行うために設け
られ、平滑化を実行し、過剰な座標点を除去し、そして
字画間の字画の長さ、交差関係等を含む特徴を抽出す
る。前処理部200はさらに、各字画のセグメントと、
45度ずつ角度が異なる8方向に応じたセグメントの方
向とを抽出し、抽出した特徴をバッファ領域900に格
納する。バッファ領域900は、入力された文字の関連
情報と特徴とを格納するために用いられる。
【0013】セグメント構成部300は、セグメント間
の空間的相対関係を判定し、その空間的相対関係に基づ
いて、規則にしたがってセグメントのシーケンスを再構
成する。規則は、隣接する交差セグメントについて、上
−下、左−右、左上−右下、および左下−右上の規則、
さらには水平−垂直の規則である。
【0014】セグメントフィルタリング部400は、再
構成されたシーケンスに基づいて、および連筆セグメン
トの方向および位置の特徴といったような特徴に基づい
て、各セグメントが他方のセグメントと連筆関係にある
かを確認する。セグメントフィルタリング部400は、
セグメントが適切に連筆セグメントと関係して構成可能
かを判定する。連筆セグメントは、適切でないと判断さ
れると削除される。全てのセグメントが検査されると、
残りのセグメントが単一の字画に結合される。セグメン
トの方向と、ペンダウンセグメント間のペンアップ中間
セグメントの方向とが再び抽出され、セグメントの総数
を計算する。
【0015】ソート部500は、字形特徴データベース
750から参照字形の範囲を見つける。参照字形は入力
文字と比較される。ソート部500は、セグメントの数
を特徴として用いて分類を行う。ソート部500は字形
特徴データベース750において、字形のセグメントの
総数が、入力された文字のセグメントの総数と、比較お
よび認識のための基準値として機能する適当な閾値とを
加えた値よりも小さい字形を探す。
【0016】比較認識部600は、字形特徴データベー
ス750を参照して動的比較法を利用することにより、
文字特徴を比較する。類似の字形が配置されると、論理
関係記述部650を参照して、初期部分と類似する字形
を有する文字の後半分の文字部分が調べられる。そして
比較認識部600は、入力された文字の残りのセグメン
トと、後半分の字形を比較し、それらが類似しているか
を判定する。このように、比較認識結果が得られる。
【0017】論理関係記述部650は、認識可能な全て
の漢字の字画の構造的関係を記録する。論理関係記述部
650の構造が、図2に詳細に示される。各文字または
字形は、0または2の構成字形およびその構成関係を含
む。関係は以下のように分類される。すなわち、上−下
(例えば、「晃」)、左−右(例えば、「松」)、上蓋
(例えば、「冠」)、半蓋(例えば、「廁」)、全蓋
(例えば、「問」)および繞(にょう)(例えば、
「迭」)関係である。より詳しくは「繞関係」とは、字
画に之繞(しんにょう)や延繞等の繞を含む漢字の構成
関係のことをいう。別の例として、「迭」、「迫」、
「迪」、「延」等が挙げられる。この関係は以下のよう
に表現される。すなわち、ローマ字「P」は、文字の第
1の字形を表す。「S」は第2の字形を表す。例えば、
「江P」は、文字「江」の第1の字形(左側部分)を表
す。
【0018】字形特徴データベース750は、漢字字形
の実際の特徴を格納して、比較認識部600による入力
された文字の認識のための参照(基準)を提供する。字
形特徴データベース750が図3に詳細に示される。各
参照文字形状の特徴は、字画数、セグメントの数、中間
ペンアップセグメントの数、各字画のセグメントの数、
(中間ペンアップセグメントを含む)セグメントの方向
のシーケンスおよび特別に記述された特徴および類似の
文字を含む。特別記述部は、類似の字形を判定するため
に、字形のある字画またはセグメントの相対位置、また
は空間的相対関係の記述を記録する。
【0019】後処理部700は、字形特徴データベース
750を参照して、比較認識部600によって獲得され
た候補文字に類似する文字を見つけ出し、候補文字およ
び類似文字を出力部800に出力する。
【0020】図4は、入力された手書き文字の前処理の
処理フローチャートを示し、前処理部200によって行
われる特徴の抽出を示す。図4に示されるように、ステ
ップS201で、手書き文字の点の座標が読み出され
る。そしてステップS202で文字の正規化処理および
細線化処理が行われ、平滑化が行われて過剰な座標点を
除去する。次に、ステップS203で文字の各字画の長
さおよび交差関係の特徴が抽出される。ステップS20
4で、各字画のセグメントとセグメントの方向とが45
度ずつ角度が異なる8方向に応じて抽出される。最後に
ステップS205で、セグメントの方向シーケンス、各
字画の特徴、交差関係などが、バッファ領域900に格
納される。
【0021】図5および6は、セグメント構成部300
の処理フローチャートを示す。図5に示されるように、
ステップS301では、前処理部200により抽出され
た第1のセグメントの座標点および方向が、バッファ領
域900から読み出される。ステップS302では、あ
るセグメントと他のセグメントとの間の空間的相対関係
が、上−下、左−右、左上−右下、左下−右上、連筆ま
たは交差かが判定される。ステップS303では、セグ
メントが最後の1つでない場合には、全てのセグメント
の検査が終了するまでステップS301〜S303が繰
り返される。その後ステップS304で、全てのセグメ
ントが集合「X」に含まれる。ステップS305では、
交差関係を持ち、集合「X」にあるセグメントが、隣接
する位置に配置される。続いて、ステップS306で
は、上−下関係を持つセグメントについて、低い方のセ
グメントが集合「X」から取り除かれる。ステップS3
07では、左−右関係を持つセグメントについて、右側
のセグメントが取り除かれる。ステップS308では、
左上−右下関係を持つセグメントについて、右下のセグ
メントが取り除かれる。ステップS309では、連筆関
係を持つ全てのセグメントが保持される。さらにステッ
プS310では、左下−右上関係を持つセグメントにつ
いて、右上のセグメントが取り除かれる。図6のステッ
プS311では、交差関係を持つセグメントについて、
水平セグメントが垂直セグメントよりも優先度が高いと
いう規則に基づいて、垂直セグメントが取り除かれる。
上のステップが行われた後、ステップS312では、集
合「X」に残存するセグメントが集合「Y」のシーケン
スに記録され、集合「X」がクリアされる。ステップS
313では、全てのセグメントが集合「Y」に含まれた
かが判定される。含まれている場合には、ステップS3
15において、集合「Y」に記録されたセグメントが順
にバッファ領域900に格納される。含まれていない場
合にはステップS314が実行され、集合「Y」に含ま
れていないセグメントを集合「X」に記録する。そして
すべてのセグメントが集合「Y」に含まれるまで、ステ
ップS305〜S314が繰り返される。
【0022】図7は、セグメントフィルタリング部40
0の処理フローチャートを示す。図7に示されるよう
に、セグメント構成部300によるセグメント構成の
後、ステップS401ではバッファ領域900から第1
のセグメントの特徴が読み出される。ステップS402
では、セグメントが他のセグメントと連筆関係にあるか
が判定される。連筆関係にあるセグメントが見つからな
ければ、その後ステップS403が実行され、セグメン
トが最後のセグメントであるかが判定される。最後のセ
グメントであれば、ステップS409が実行される。最
後のセグメントでなければ、ステップS401〜S40
3が繰り返される。逆に、ステップS402で第1のセ
グメントと連筆関係にあるセグメントが見つけられる
と、ステップS404が実行され、第1のセグメントと
連筆関係にある全てのセグメントが検査されたかが判定
される。検査されていない場合には、ステップS405
が実行されて検査された連筆セグメントは隣接するセグ
メントであるかが判定される。連筆セグメントが隣接セ
グメントの場合には、ステップS408が実行される。
連筆セグメントが隣接セグメントでない場合には、ステ
ップS401が繰り返される。逆に、ステップS404
で第1のセグメントと連筆関係にある全てのセグメント
が検査されると、ステップS406が実行され、バッフ
ァ領域900から連筆セグメントの方向の特徴が読み出
される。そして、ステップS407でセグメントの方向
および位置が検査され、字画が、連筆セグメントの適切
な連筆したセグメントの方向および位置を構成できるか
が判断される。構成できる場合には、ステップS403
が繰り返される。構成できない場合には、ステップS4
08が行われ、入力されたセグメントが削除される。セ
グメントの削除の後は、ステップS403が実行され、
全てのセグメントが検査されたかが判定される。検査さ
れていなければ、ステップS401が繰り返され、次の
セグメントの特徴が読み出される。検査されている場合
は、ステップS409で全てのセグメントが1字画で連
結され、セグメントの方向および、ペンダウンセグメン
ト間の中間ペンアップセグメントの方向が抽出され、セ
グメントの総数が計算される。最後にステップS410
で、セグメントの特徴がバッファ領域900に格納され
る。
【0023】図8は、ソート部500の処理フローチャ
ートを示す。図8に示されるように、ステップS501
では、バッファ領域900から入力された文字のセグメ
ントの総数「num」が読み出される。その後ステップ
S502では、セグメント数が、「num」に適当な閾
値を加えた値よりも小さくなる最後の字形の位置が得ら
れる。最後にステップS503で、最後の字形の位置が
バッファ領域900に記録される。
【0024】図9は、比較認識部600の処理フローチ
ャートを示す。図9に示されるように、ステップS60
1では、バッファ領域900から各セグメントの特徴が
読み出される。ステップS602では、各セグメントの
方向およびシーケンスが、動的比較法を用いて、字形特
徴データベース750内の参照字形のセグメントの方向
およびシーケンスと比較される。そして、残りの特徴が
比較され、比較値を計算する。その後、ステップS60
3で、比較値が閾値よりも小さくなく、ステップS60
4において、字形特徴データベース750内にいまだ比
較されていない字形が存在する場合には、ステップS6
02が繰り返され、字形特徴データベース750内の次
の参照字形が比較される。ステップS603で、比較値
が閾値よりも小さくないが、しかしステップS604に
おいて、比較に利用可能な参照字形が字形特徴データベ
ース750内にない場合には、ステップS605が実行
され、全てのセグメントが検査されたかが判定される。
検査されていない場合には、ステップS601が繰り返
され、次のセグメントの特徴を読み出す。検査された場
合には、ステップS610が実行される。ステップS6
03で、比較値が閾値よりも小さい場合には、ステップ
S606が実行され、類似の字形を獲得し、論理関係記
述部650を参照して、初期部分と類似する字形を持つ
文字の残存する構成字形を調べる。次にステップS60
7では、字形特徴データベース750が参照され、入力
された文字の残存するセグメントが文字の残存する構成
字形の特徴と比較され、比較値が計算される。ステップ
S608では、比較値が閾値よりも小さい場合には、ス
テップS610が実行され、バッファ領域900にその
結果を格納し、処理が終了する。比較値が閾値よりも小
さくない場合には、ステップS609が実行され、初期
部分に類似する字形によって構成されている文字が存在
するかが判定される。存在する場合には、ステップS6
06が繰り返され、論理関係記述部650を参照して、
初期部分に類似する字形を有する文字の、残存する構成
字形を探しつづける。存在しない場合には、ステップS
602が実行され、字形特徴データベース750内の参
照字形と比較し続け、類似字形の位置を特定する。
【0025】図10は、後処理部700の処理フローチ
ャートを示す。図10に示されるように、ステップS7
01では、バッファ領域900から、比較認識部600
により位置が特定された候補文字の結果が読み出され
る。ステップS702では、論理関係記述部650が参
照され、候補文字と類似する漢字を見つけ出す。ステッ
プS703では、候補文字および類似する漢字が、認識
結果として出力部800に出力される。
【0026】本発明による、自由な字画筆順および連筆
字画に対応した手書き漢字認識装置の実施の形態を参照
して、その装置の基本的動作を説明する例として、文字
「汪」を用いる。
【0027】入力部100を用いて、手書き文字「汪」
が入力される(図11)。その後、前処理部200によ
る処理が行われる。図4に示す処理フローチャートによ
ると、ステップS202では、正規化処理および細線化
処理が行われ、次に平滑化処理が行われて過剰な座標点
が除去される。ステップS203では、その文字の各字
画の長さおよび交差関係を含む特徴が抽出される。そし
てステップS204において、セグメントとセグメント
の方向とが45度ずつ角度が異なる8方向に応じて抽出
される。最後にステップS205で、セグメントの方向
シーケンスと、各字画の特徴、および交差関係がバッフ
ァ領域900に格納される。入力された文字「汪」の抽
出された特徴が、図11に列挙されている。
【0028】続いて、図5および6にしたがって、セグ
メント構成部300が処理を行う。ステップS302で
は、バッファ領域900から座標点および第1のセグメ
ント「\」の方向が読み出される。ステップS302
で、他のセグメントに対する空間的相対関係が判定され
る。そしてステップS303では、そのセグメント
「\」は最後のセグメントではないので、全てのセグメ
ントが検査されるまでステップS301〜S303が繰
り返される。全てのセグメント間の空間的相対関係が図
10Bに列挙されている。処理は続いて、ステップS3
04では、全てのセグメントが集合「X」に含められ
る。ステップS305では、交差セグメント5および7
は隣接する位置にないので、セグメント7と6とが入れ
換えられ、セグメント7がセグメント5の後に移動され
る。その後ステップS306では、上−下関係を持つセ
グメントのうち、低い方のセグメントが除去される。つ
まりセグメント2,3,5,6,7,8,9が除去さ
れ、セグメント1および4は、集合「X」内に残され
る。ステップS307では、セグメント1および4は左
―右関係を持ち、セグメント4はセグメント1の左にあ
る。このときセグメント4は除去されて、集合「X」に
残存するのはセグメント1のみになる。そのためステッ
プS308〜S311(図6)は機能しない。続いて、
図6のステップS312では、集合「X」内のセグメン
ト1が集合「Y」に含められ、集合「X」がクリアされ
る。さらに、ステップS313では、集合「Y」が全て
のセグメントを含んでいないので、ステップS314が
実行され、集合「X」内のセグメント1を除く他のセグ
メントを記録する。全てのセグメントが集合「Y」に含
まれるまで、ステップS305〜S314が繰り返され
る(1回ごとに集合「Y」に格納されるセグメントが、
図13に列挙される)。最後にステップS315では、
集合「Y」に記録されたセグメントのシーケンス(セグ
メント1、2、3、4、7、5、6、8、9)がバッフ
ァ領域900に格納される。
【0029】その後、セグメントフィルタリング部40
0が処理を行う。図7に示されるフローチャートによる
と、ステップS401では、バッファ領域900からセ
グメント構成の後の第1のセグメント(すなわち、セグ
メント1「\」)の特徴が読み出される。ステップS4
02では、セグメント1が他のセグメントと連筆関係に
あることがわからないので、また、ステップS403で
はセグメント1が最後のセグメントではないので、ステ
ップS401が実行される。ステップS401〜S40
3は、第5のセグメント、すなわちセグメント7「−」
の特徴がステップS401で読み出されるまで繰り返さ
れる。ステップS402では、セグメント7が、セグメ
ント6および8と連筆関係にあると判断される。そして
ステップS404が実行される。セグメント6および8
は、それぞれ第7および第8のセグメントなので、そし
てまだ検査する必要があるので、ステップS401がス
テップS405を経て継続される。ステップS401で
は、バッファ領域900から第6のセグメント、すなわ
ちセグメント5「|」が読み出される。ステップS40
2では、セグメント5がセグメント6と連筆関係にある
と判断されるので、ステップS404が実行される。セ
グメント6および8はそれぞれ第7および第8のセグメ
ントであり、まだ検査しなければならないので、ステッ
プS405を経てステップS401が実行される。ステ
ップS401では、バッファ領域900から第6のセグ
メント、すなわちセグメント5「|」が読み出される。
ステップS402では、セグメント5はセグメント6と
連筆関係にあると判断されるので、ステップS404が
実行される。セグメント6はまだ検査しなければならな
いので、ステップS401が実行される。ステップS4
01では、バッファ領域900から第7のセグメント、
すなわちセグメント6「\」の特徴が読み出される。ス
テップS402では、セグメント6はセグメント5およ
び7と連筆関係にあると判断される。そしてステップS
404が実行される。セグメント5および7は検査され
ているので、ステップS406で、バッファ領域900
からセグメント7および5の方向の特徴(それぞれ
「0」および「6」(図3に列挙された方向コード))
が読み出される。ステップS407では、セグメント7
が左から右へと書かれており、かつセグメント5は下方
向に書かれているので、それにより構成される連筆セグ
メントの方向は、右下から左上になる。これはセグメン
ト6の方向と一致する。しかし、セグメント6は、セグ
メント7の始点においてセグメント7と結合しており、
かつセグメント5の終点においてセグメント8と結合し
ているので、そのためセグメント6は適切な連筆セグメ
ントを構成しないと判定される。そしてステップS40
8でセグメント6が除去される。その後、ステップS4
03では、全てのセグメントをまだ検査する必要がある
かが判定される。ステップS401では、バッファ領域
900から第8のセグメントの特徴、すなわちセグメン
ト8「/」が読み出される。ステップS402では、セ
グメント8がセグメント7および9と連筆関係を持つこ
とがわかる。ステップS404では、セグメント9をま
だ検査しなければならない。検査されたセグメント7
が、ステップS405で隣接するセグメントでないこと
がわかると、ステップS408でセグメント8が除去さ
れる。ステップS403では、全てのセグメントが検査
されたかが判定される。ステップS401では、バッフ
ァ領域900から最後のセグメントの特徴、すなわちセ
グメント9「―」が読み出される。ステップS402で
は、セグメント9が他のセグメントと連筆関係を持たな
いことがわかり、ステップS403では最後のセグメン
トであることがわかる。したがって、ステップS409
が実行されて単一字画の全ての残存するセグメント1,
2,3,4,7,5,9を結合し、再びセグメントの方
向と、ペンダウンセグメント間の中間ペンアップセグメ
ントの方向が抽出され、セグメントの総数(ここでは、
中間ペンアップセグメントの数を含む13)が計算され
る。ステップS410では、その特徴がバッファ領域9
00に格納される。
【0030】次に、ソート部500が処理を行う。図8
のフローチャートによると、ステップS501では、バ
ッファ領域900からセグメントの総数13が読み出さ
れる。ステップS502では、適切な閾値として数字
「10」が採用され、最後の字形の位置を計算する。最
後の字形は、字形特徴データベース750が参照されて
23のセグメント数を持つ。最後に、ステップS503
では、その位置がバッファ領域900に記録される。
【0031】続いて、比較認識部600が処理を行う。
図9のフローチャートによると、ステップS601で
は、バッファ領域900から第1のセグメントの特徴
「\」が読み出される。ステップS602では、第1の
セグメントが字形特徴データベース750内の参照字形
「―」と比較され、比較値が獲得される。第1のセグメ
ントは、方向シーケンスおよび他の特徴の点から、入力
されたセグメント数1以上のセグメント数を持つが、総
セグメント数13よりも小さい。ステップS603で
は、比較値が閾値よりも小さいとわかる。ステップS6
06では、論理関係記述部650が参照され、文字
「二」の他方の構成字形「―」が初期字形「―」(図2
参照)を有することがわかる。ステップS607では、
字形特徴データベース750がさらに参照され、入力さ
れた文字の残存するセグメントの特徴が他の構成字形
「―」と比較される。ステップS608では、比較値が
閾値よりも大きいことがわかる。ステップS609で
は、初期字形として「―」をまだ有している文字が存在
するかが判定される。初期字形として「―」を有する文
字が存在しなくなるまで、ステップS606〜S609
が繰り返される。次にステップS602が実行され、字
形特徴データベース750内の他の参照字形との比較が
行われる。字形特徴データベース750内に、比較のた
めに残された参照字形が存在しなくなるまで、ステップ
S602〜S609が繰り返される。ステップS605
では、入力された文字の全てのセグメントを検査する必
要があるかが判定される。そしてステップS601が行
われ、バッファ領域900から次のセグメントの特徴が
読み出される。そして、文字「汪」が見つけられるま
で、同様にしてステップS601〜S609が繰り返さ
れる。文字「汪」は、2つの字形「江P」(「江」の第
1の字形)および「王」から形成されている。ステップ
S610では、結果がバッファ領域900に格納され
る。
【0032】最後に、後処理部700が処理を行う。図
10のフローチャートによると、ステップS701で
は、バッファ領域900から候補文字「汪」が読み出さ
れる。ステップS702では、論理関係記述部650が
参照され、候補文字「汪」に類似する漢字が存在しない
か判断される。最後に、ステップS703では、候補文
字「汪」が認識結果として、出力部800に出力され
る。
【0033】
【発明の効果】認識可能な対象としての第1の頻繁に使
用される漢字、すなわち5401個の漢字とともに、セ
グメントの再構成および不適切なセグメントの削除に基
づいた、本発明による自由な字画筆順および連筆字画に
対応した手書き漢字認識装置が使用されると、連筆字画
でない筆跡データを自由な字画筆順で認識すると、効率
は95%より高くなる。自由な連筆字画筆跡データに関
しても、認識効率は92%にも上る。したがって、本発
明は字画筆順の自由の問題を効率的に解決できるだけで
なく、ユーザが連筆字画の文字を入力することを許すこ
とができる最も実用的かつ好ましいと考えられる実施の
形態に関連して本発明を説明してきたが、本発明は開示
された実施の形態に制限されることはない。本発明は、
最も広い解釈の精神および範囲の中のさまざまな構成を
含むよう理解され、それにより、そのような全ての修正
および等価な構成を包含する。
【0034】本発明によるオンライン手書き漢字認識装
置は、自由な字画筆順および字画を連筆する自由につい
ての問題を解決することができる。それにより文字認識
の速度が向上する。
【図面の簡単な説明】
【図1】 本発明の好ましい実施の形態のシステムのブ
ロック図である。
【図2】 好ましい実施の形態の論理関係記述部の構造
の模式図である。
【図3】 好ましい実施の形態の字形特徴データベース
の構造の模式図である。
【図4】 好ましい実施の形態の前処理部の処理のフロ
ーチャートである。
【図5】 好ましい実施の形態のセグメント構成部の処
理のフローチャートである。
【図6】 図5に続く、好ましい実施の形態のセグメン
ト構成部の処理のフローチャートである。
【図7】 好ましい実施の形態のセグメントフィルタリ
ング部の処理のフローチャートである。
【図8】 好ましい実施の形態のソート部の処理のフロ
ーチャートである。
【図9】 好ましい実施の形態の比較認識部の処理のフ
ローチャートである。
【図10】 好ましい実施の形態の後処理部の処理のフ
ローチャートである。
【図11】 好ましい実施の形態による手書き文字
「汪」の抽出された特徴を示す図である。
【図12】 好ましい実施の形態による手書き文字
「汪」のセグメント間の空間的相対関係を示す図であ
る。
【図13】 好ましい実施の形態による手書き文字
「汪」のセグメントを構成する処理を示す図である。
【図14】 従来の技術の漢字形状認識システムのブロ
ック図である。
【符号の説明】
100 入力部 200 前処理部 300 セグメント構成部 400 セグメントフィルタリング部 500 ソート部 600 比較認識部 650 論理関係記述部 700 後処理部 750 字形特徴データベース 800 出力部 900 バッファ領域

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 ディジタイジングボードおよびペンから
    形成された入力部と、データを一時的に格納するバッフ
    ァ領域と、出力部を有する自由な字画筆順および連筆字
    画に対応した手書き漢字認識装置であって、 認識可能な全ての漢字の字形の構造関係を記録する論理
    関係記述部と、 字画数と、セグメント数と、漢字字画のペンダウンセグ
    メント間の中間ペンアップセグメント数と、前記字画そ
    れぞれのセグメント数と、セグメント方向シーケンス
    と、特別に記述された特徴と、類似文字とを格納する字
    形特徴データベースであって、前記セグメント方向シー
    ケンスは、前記ペンダウンセグメント間の中間ペンアッ
    プセグメントの方向を含む字形特徴データベースと、 前記入力部により入力された手書き文字の正規化処理お
    よび細線化処理を行い、過剰な座標点を削除した後、前
    記字画の長さと前記字画の間の交差関係とを含む特徴を
    抽出し、全ての字画の全てのセグメントと前記セグメン
    トの方向とを45度ずつ角度が異なる8方向に応じて抽
    出して前記バッファ領域に格納する前処理部と、 前記前処理部により抽出された各セグメントの座標点と
    方向とに応じて、前記セグメント間の空間的相対関係を
    判定し、隣接しかつ交差するセグメントに対して上−
    下、左−右、左上−右下、および左下−右上、および水
    平−垂直の規則にしたがって、全てのセグメントの筆順
    を再構成するセグメント構成部と、 前記セグメント構成部により再構成されたセグメントの
    シーケンスにしたがって前記セグメント1つごとの適切
    さを検査するセグメントフィルタリング部であって、あ
    るセグメントが他のセグメントと連筆関係にあると判断
    されると、前記連筆関係にあるセグメントの方向および
    位置の特徴に基づいて、前記セグメントが連筆関係にあ
    るセグメントに対し適切な連筆セグメントを構成するか
    否かを判定し、適切でなければ連筆関係にあるセグメン
    トを削除し、全てのセグメントを検査すると、残存する
    セグメントを完全に結合し、セグメントのペンダウン方
    向と、ペンダウンセグメント間のペンアップ中間セグメ
    ントの方向とを再び抽出し、バッファ領域へ格納するセ
    グメントの総数を計算するセグメントフィルタリング部
    と、 前記字形特徴データベースにおいて、前記字形のセグメ
    ントの総数が、入力された前記文字のセグメントの総数
    と比較および認識のための基準値として機能する適当な
    閾値とを加えた値よりも小さい字形を探し、前記セグメ
    ントフィルタリング部により得られた前記セグメント数
    を特徴として用いて分類を行うソート部と、 動的比較法を用いて、および前記字形特徴データベース
    を参照して、前記ソート部により得られた字形と、セグ
    メントフィルタリングにより得られた前記文字の特徴を
    比較し、類似字形を見つけ出し、前記論理関係記述部か
    ら前記類似字形を初期位置として有する文字を調べ、前
    記文字の後ろ半分の字形を入力された文字の残存するセ
    グメントと比較し、それらが類似しているかを判定し、
    それにより比較認識結果を獲得する比較認識部と、 前記字形特徴データベースへの参照を行って、前記比較
    認識部により得られた候補文字に類似する文字を見つけ
    出し、前記候補文字および前記類似する文字を出力する
    後処理部とを備えた手書き漢字認識装置。
JP2000065095A 2000-03-09 2000-03-09 自由な字画筆順および連筆字画に対応したオンライン手書き漢字認識装置 Pending JP2001256437A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000065095A JP2001256437A (ja) 2000-03-09 2000-03-09 自由な字画筆順および連筆字画に対応したオンライン手書き漢字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000065095A JP2001256437A (ja) 2000-03-09 2000-03-09 自由な字画筆順および連筆字画に対応したオンライン手書き漢字認識装置

Publications (1)

Publication Number Publication Date
JP2001256437A true JP2001256437A (ja) 2001-09-21

Family

ID=18584682

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000065095A Pending JP2001256437A (ja) 2000-03-09 2000-03-09 自由な字画筆順および連筆字画に対応したオンライン手書き漢字認識装置

Country Status (1)

Country Link
JP (1) JP2001256437A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7142715B2 (en) * 2003-01-17 2006-11-28 Sakhr Software Company Arabic handwriting recognition using feature matching
CN105320971A (zh) * 2014-06-09 2016-02-10 株式会社日立信息通信工程 字符识别装置和字符识别方法
KR101891103B1 (ko) 2016-12-07 2018-08-24 주식회사 셀바스에이아이 한글 문자의 필순 복원 방법
CN113095171A (zh) * 2021-03-29 2021-07-09 Oppo广东移动通信有限公司 书写字符识别方法及装置、电子设备、存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7142715B2 (en) * 2003-01-17 2006-11-28 Sakhr Software Company Arabic handwriting recognition using feature matching
CN105320971A (zh) * 2014-06-09 2016-02-10 株式会社日立信息通信工程 字符识别装置和字符识别方法
CN105320971B (zh) * 2014-06-09 2018-11-16 株式会社日立信息通信工程 字符识别装置和字符识别方法
KR101891103B1 (ko) 2016-12-07 2018-08-24 주식회사 셀바스에이아이 한글 문자의 필순 복원 방법
CN113095171A (zh) * 2021-03-29 2021-07-09 Oppo广东移动通信有限公司 书写字符识别方法及装置、电子设备、存储介质

Similar Documents

Publication Publication Date Title
JP4098880B2 (ja) 情報検索装置
CN104008363B (zh) 手写轨迹的检测、规范化和在线识别以及异常字根的收集
US10127199B2 (en) Automatic measure of visual similarity between fonts
EP1971957B1 (en) Methods and apparatuses for extending dynamic handwriting recognition to recognize static handwritten and machine generated text
CN107609489B (zh) 书法书写路径评价装置、方法及电子设备
US7369702B2 (en) Template-based cursive handwriting recognition
CN111931710B (zh) 一种联机手写文字识别方法、装置、电子设备及存储介质
EP3535689A1 (en) Method and system for transforming handwritten text to digital ink
JP2001325564A (ja) 部首モデルに基づく草書体漢字の手書き注釈の検索
CN105260751B (zh) 一种文字识别方法及其系统
CN102693334B (zh) 基于cad电子图纸的动态构件识别方法
JPH06176200A (ja) パターン認識方法及び装置
CN106250804A (zh) 减少的文档笔划存储
CN113239818B (zh) 基于分割和图卷积神经网络的表格跨模态信息提取方法
CN114730241B (zh) 触摸式用户界面输入中的手势笔画识别
CN100481115C (zh) 字符检索装置
CN101697234A (zh) 一种基于笔画分段建模的手写汉字隶书美化方法
JP2001256437A (ja) 自由な字画筆順および連筆字画に対応したオンライン手書き漢字認識装置
CN112256909A (zh) 一种图形商标检索方法、系统、设备及可读存储介质
JPH0610829B2 (ja) 手書き文字認識方法
CN115393865A (zh) 文字检索方法、设备以及计算机可读存储介质
CN111382749B (zh) 一种基于二维结构特征的青铜器铭文图像自动识别方法
CN114926842A (zh) 东巴象形文字识别方法及装置
CN1075811A (zh) 自由书写联机手写汉字识别方法及其系统
CN106774974B (zh) 输出信息的方法和装置