JP2000200323A - オンライン手書き漢字認識装置 - Google Patents

オンライン手書き漢字認識装置

Info

Publication number
JP2000200323A
JP2000200323A JP11302466A JP30246699A JP2000200323A JP 2000200323 A JP2000200323 A JP 2000200323A JP 11302466 A JP11302466 A JP 11302466A JP 30246699 A JP30246699 A JP 30246699A JP 2000200323 A JP2000200323 A JP 2000200323A
Authority
JP
Japan
Prior art keywords
character
kanji
radical
code
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11302466A
Other languages
English (en)
Inventor
Okubun Cho
憶文 張
Shunkitsu Kaku
俊桔 郭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP11302466A priority Critical patent/JP2000200323A/ja
Publication of JP2000200323A publication Critical patent/JP2000200323A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 大量のテンプレートを要することなく漢字の
認識が行えるようにする。 【解決手段】 本発明では、入力された手書き漢字は構
成部首に分解される。その後、入力方法のコード検索規
則を参照し、手書き漢字の文字構成方法に基づいて、比
較のための部首が検索される。次いで、入力方法の圧縮
式を使用して基本部首のコードが圧縮され、圧縮された
コードが入力方法参照ファイルの内容と比較され、候補
漢字の順序コードが取得される。最後に、最終的に認識
された順序コードが、後処理の間に行われるさらなる比
較を経て決定される。文字フォントファイルに於ける順
序コードに対応する漢字が認識結果であり、これが出力
される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字の形に基づく
手書き漢字のオンライン判読に関し、さらに特定的に
は、ある入力方法の文字圧縮コード−順列コード参照フ
ァイルを参照し、構築された部首を使用して文字の形を
比較することによって認識を行うオンライン手書き漢字
認識装置に関する。
【0002】
【従来の技術】現行の文字認識方法は、一般にテンプレ
ート整合法を採用しており、この場合は入力された未知
の文字の輪郭が1つずつ、予め格納されている文字ペン
インクテンプレートと比較される。認識の結果が比較さ
れたテンプレートであり、最大の類似性と最小の差異を
有している。この技術では、より良い認識効果を確立す
るために膨大な数の文字ペンインクテンプレートを格納
しなければならない。大部分の文字認識方法は、膨大な
数の文字ペンインクテンプレートとの比較に費やされる
時間を短縮する目的で、分類方法またはその他の比較方
法をテンプレート技術と組み合わせて使用している。し
かしながら、それでもまだ多くの文字ペンインクテンプ
レートを格納しなければならない。
【0003】R.O.C.(中華民国)特公第3112
01号公報に開示された「前側及び後側部首に基づく手
書き漢字認識システム」と題する発明の特徴は、前側部
首と後側部首を使用して漢字を3つの主要クラス、即ち
前側部首プラス後側漢字残余部分、後側部首プラス前側
漢字残余部分、単形式文字、に分類することにある。従
って、漢字認識システムはこの分類方法を使用して確立
される。図13はこうしたシステムの部分を確立するモ
デルボードのブロック図を示しており、各グループが異
なる人々によって手書きされた5401漢字を有する8
0グループの漢字ペンインクデータを格納するための漢
字インクデータベース10と、漢字が前側部首漢字、後
側部首漢字、単形式漢字の何れであるかを決定する分類
方法に基づいて漢字をグループ分けするための漢字イン
ク分類辞11と、前側部首漢字を前側の部首部分と後側
の残余漢字部分とに分離するため、或いは後側部首漢字
を後側の部首部分と前側の残余漢字部分とに分離するた
めの部首分離器12と、単形式漢字の特徴点を抽出し、
こうした特徴を単形式漢字の画数に従って単形式漢字モ
デルボード16内に順次格納するための単形式漢字モデ
ルボード生成器13と、前側部首と後側部首の特徴を抽
出し、こうした特徴を部首の画数に従って前側部首モデ
ルボード17内と後側部首モデルボード18内とに順次
格納するための部首モデルボード生成器14と、前側漢
字残余部分と後側漢字残余部分の特徴を抽出し、こうし
た特徴を漢字残余部分の画数に従って前側残余漢字モデ
ルボード19内と後側残余漢字モデルボード20内とに
順次格納するための残余漢字モデルボード生成器15
と、を備えている。
【0004】図14は、従来型認識システムのブロック
図を示している。この認識システムは、原初のペンイン
クのノイズ信号の除去、平滑化、シフト修正、循環翻訳
修正、サイズ標準化及び希望する特徴の抽出処理のため
の前処理器21と、入力されたペンインクの部分的特徴
を使用して可能なモデルボードを選択的に濾過するため
のフィルタ22と、入力されたペンインクから可能な前
側部首部分を分離し、シフトされた前側部首モデルボー
ドと詳細に比較し、両者間の類似度を計算し、類似度が
最も高い10の前側部首を記録するための前側部首比較
器23と、入力されたペンインクから可能な後側部首部
分を分離し、シフトされた後側部首モデルボードと詳細
に比較し、両者間の類似度を計算し、類似度が最も高い
10の後側部首を記録するための後側部首比較器24
と、入力された現行字画を、前側部首に対応するものが
前側部首比較器23の結果の最初の10リストに存在す
る後側残余漢字モデルボード内の字画と比較し、次いで
前側部首比較器23のオペレーションで獲得された類似
度と現ステップに於ける類似度とを結合して入力された
現行文字の類似度を取得する後側残余漢字比較器25
と、入力された現行字画を、後側部首に対応するものが
後側部首比較器24の結果の最初の10リストに存在す
る前側残余漢字モデルボード内の字画と比較し、次いで
後側部首比較器24のオペレーションで獲得された類似
度と現ステップに於ける類似度とを結合して入力された
現行文字の類似度を取得する前側残余漢字比較器26
と、シフトされた単形式漢字モデルボードと入力された
ペンインクとの間の類似度を計算するための単形式漢字
比較器27と、比較の後に類似度を配列し、類似度が最
大であるトップ10の漢字を認識結果として保持するた
めのウィナー判定器28と、を備えている。
【0005】
【発明が解決しようとする課題】R.O.C.特公第3
11201号公報に開示された「前側及び後側部首に基
づく手書き漢字認識システム」と題する発明の欠点は、
1.モデルボードの確立ステップ及び漢字の認識ステッ
プに於いて、多大の漢字ペンインクデータセットを必要
とする(各セットが認識パーティとして機能する540
1漢字を含んでいる)、2.予め大量のモデルボード
(テンプレート)を準備しなければならないため、膨大
な時間が掛かる、等である。
【0006】
【課題を解決するための手段】先述のテンプレート整合
では多数の漢字ペンインクテンプレートを格納する必要
があり、その結果、格納スペースやテンプレートの整合
時間が浪費されるという事実を考慮して、本発明は、漢
字の形を基礎としたオンライン手書き認識装置を提供し
て、漢字インクテンプレートの格納スペースと整合時間
を低減することを目的としている。
【0007】前述の欠点を克服するため、本発明は、デ
ータを一時的に格納するためのバッファ領域と出力部と
を有し、文字の形状による分解を基礎とする入力方法に
よって定義された基本的部首(即ち、基本部首)または
関連部首(即ち、派生部首)の形状的特徴を含む部首テ
ンプレート特徴記憶部と、文字の形状による分解に基づ
く従来の入力方法を基礎とし、文字圧縮コード及び順序
コード探索情報のための入力方法システムデータファイ
ルを含む入力方法参照部と、除外漢字の特徴を記録し
て、候補漢字の中から最終の認識結果を決定する際に後
処理部を補助するための除外文字記述部と、従来型のオ
ンライン文字手書き装置のデジタル化タブレットとペン
とを含む入力部と、入力された手書き文字に対して標準
化及びライン希薄化処理を行ない、バッファ領域への格
納のために文字認識に必要な特徴を抽出するための前処
理部と、前処理部によって抽出された手書き文字の特徴
をもとに部首テンプレート特徴記憶部を参照して文字を
分解し、手書き文字を形成している可能性のある部首を
発見するための文字形状分解部と、文字形状分解部によ
って発見された構成部首と入力方法参照部の内容とを比
較し、限界値より下の差分値を有する候補文字を取得す
るための比較器部と、候補文字の中から、手書き文字の
他の特徴をもとに除外文字記述部分の内容を参照して最
終的な認識結果を決定し、最終認識結果を出力部に転送
して出力するための後処理部と、を備えることを特徴と
するオンライン手書き漢字認識装置を提供している。
【0008】上述の構造から、本発明によるオンライン
手書き漢字認識装置は、手書き文字を文字形状分解手段
を通じて構成部首に分解するため、文字形状による分解
を基礎とする従来の入力方法による文字圧縮コード及び
順序コード参照用テーブルを使用して、認識結果を直接
取得することができる。オンライン手書き漢字認識シス
テムでは、整合に必要なテンプレートの数を低減し、整
合のための時間を短縮することができる。
【0009】
【発明の実施の形態】好適な実施例の文字認識は、文字
形状による文字分解を基礎とするTsangChi入力
方法を土台としている。Tsang Chi入力方法に
於いて定義されている基本部首、派生部首及び複合部首
は、図12が示すような好適な実施例に於いて表示され
た部首テンプレートセットである。Tsang Chi
入力方法では、漢字の構造及び文字構成原理に従って、
漢字が24のTsang Chi基本部首と74の派生
部首へと帰属させられる。その後、漢字はTsangC
hiコード派生規則に基づいて最大5つのTsang
Chiコードに分解され、これによって適正なTsan
g Chiコードが入力されて適正文字が取得される。
【0010】図1は、本発明によるオンライン手書き漢
字認識装置の好適な実施例のブロック図である。デジタ
ル化タブレット等の入力部100は、ユーザによるオン
ライン文字の書込みの実行を可能にするために装備され
ている。前処理部200は、ユーザによって入力された
手書き文字の標準化及びライン希薄化処理を実行し、文
字分離技術を使用して各文字を5つのグループ、即ち外
側−内側、上−下、左−右、複数欄または単形式(図1
1参照)、に分割するために装備されている。次いでバ
ッファ領域700で、文字の特徴が抽出され、格納され
る。抽出される特徴は、字画、字画の位置、字画の始点
及び終点方向、各字画が属するレベル他の間の交差する
関係性を含んでいる。各字画が属するレベルは、漢字の
書き順とそれが帰属する単形式とによって決定される。
バッファ領域700は、入力された字画の関連データ及
び特徴を格納するために使用される。
【0011】文字形式分解部300は、文字の特徴を部
首テンプレート特徴記憶部350の内容と比較して、各
字画から構築される可能性のある部首セットを取得す
る。その後、コード検索規則に基づいて、文字を形成可
能な部首セットが帰属する基本部首のためのコードが摘
出される。部首テンプレート特徴記憶部350は、全て
の部首テンプレートの特徴を格納するために使用され
る。図6は、当該部首テンプレート特徴記憶部の詳細な
構造について示したものである。各部首テンプレートの
ためのデータは、画数、方向及び長さ等の字画の特徴、
字画間の交差する関係性及び類似した部首テンプレート
のコードを含んでいる。
【0012】比較器部400は、文字分解後に取得され
た部首セットが帰属する基本部首のコードに対応する圧
縮コードと、入力方法参照部450の内容とを比較し
て、候補文字の順序コードを発見する働きをする。入力
方法参照部450は、文字圧縮コード及び順序コード探
索データのための入力方法システムデータファイルを含
み、候補文字の順序コード取得に際して、比較器部40
0を補助するために使用される。図7は、本発明に於い
て使用される内容の一部を示したものである。
【0013】後処理部500は、除外文字記述部550
を参照して、多数の候補文字の中から最終的な認識結果
を発見する。除外文字記述部550は、多数の候補文字
の中から最終的な認識結果を発見する際に、後処理部5
00を補助するための参照部である。図8は、除外文字
記述部550の構造を示したものである。各順序コード
(1文字を表す)は、総画数、及び13を基本とし除外
文字を形成する文字コードの画数が圧縮されている圧縮
データを含んでいる。
【0014】前述の装置の構造に関連して、図2は、前
処理部200によって実行される、入力された手書き文
字の前処理及び特徴抽出の工程フローチャートを示して
いる。図3は、文字形式分解部300によって実行され
る、入力文字の分解及び基本部首コードの選択の工程フ
ローチャートを示している。図4は、比較器部400に
よって実行される、入力文字に帰属する基本部首コード
に対応する圧縮コードと入力方法参照部450の内容と
の比較によって候補文字が発見される方法を示した工程
フローチャートである。図5は、後処理部500によっ
て実行される、候補文字の間から出力文字が決定される
方法を示した工程フローチャートである。
【0015】図2が示すように、前処理部200は、ス
テップS201に於いて、手書き文字の点座標を読み取
る。その後、ステップS202で、文字の標準化及びラ
イン希薄化処理が実行される。ステップS203では、
文字分離技術の使用により、文字が外側−内側、上−
下、左−右、複数欄または単形式に分離される。ステッ
プS204では、文字の各字画の方向及び長さの特徴、
及び字画間の交差する関係性に於ける特徴が抽出され
る。最後に、ステップS205で、抽出された特徴が一
時的格納のためにバッファ領域700へと出力される。
【0016】図3が示すように、ステップS301で
は、書き順に従って、前処理部200から抽出された字
画の各特徴がバッファ領域700から読み取られる。ス
テップS302では、部首テンプレート特徴記憶部35
0が参照され、入力された字画の特徴と部首テンプレー
ト特徴記憶部350に格納された各部首テンプレートの
特徴とが比較されて、入力された字画との高い類似度を
有する部首セットが発見される。ステップS303で
は、発見された部首のコードが、バッファ領域700に
於ける当該字画の場所に格納される。その後、ステップ
S304で、入力された字画が当該字画と交差する先行
字画と結合され、ステップS305で、部首テンプレー
ト特徴記憶部350を参照し、結合された形状が部首テ
ンプレート特徴記憶部350に格納された各部首テンプ
レートの特徴と比較され、結合された字画から一般に形
成可能な部首が発見される。ステップS306では、発
見された部首のコードが、バッファ領域700の現行字
画及び付随する交差字画の関連情報が格納される場所に
格納される。ステップS307では、入力された字画が
同一レベルの先行字画と結合され、ステップS308で
は、部首テンプレート特徴記憶部350が参照され、結
合された形状と部首テンプレート特徴記憶部350に格
納された部首テンプレートの特徴とが比較され、結合さ
れた字画から一般に形成可能な部首が発見される。ステ
ップS309では、発見された部首のコードが、バッフ
ァ領域700内の入力された字画及び同一レベルの先行
字画の場所に格納される。部首テンプレートのための字
画数は最大13である(「鬼」)ため、12画までしか
検査が行われていない時点で先行字画との組合せステッ
プが実行される。ステップS310で全字画の検査が終
了すると、ステップS311で、バッファ領域700に
於ける各字画から形成可能な部首セットに関する情報の
中から、各字画について、大部分の字画数から形成可能
な部首セットが発見される。ステップS312では、全
字画について大部分の字画数から形成可能な部首が発見
された後、コード検索規則に従って、大部分の字画数か
ら形成されるこうした部首セットについて、比較のため
の部首セット及びこれに帰属する基本部首のコードが発
見される。ステップS313では、発見された部首が帰
属する基本部首のコードが、バッファ領域700に格納
される。
【0017】比較器部400の比較技術等、先行技術に
比べた場合の本発明による顕著な進歩は、整合速度の高
速化、及びデータ格納用スペースの低減を可能にするも
のであり、以下、これについて詳述する。本発明は、同
一の中国語システムに於いて異なる入力方法の使用が可
能であったことから始まっている。異なる格納形式も使
用可能であった。しかしながら、最終的結果は、同一の
文字フォントファイルが読み取られるというものであ
る。漢字フォントファイルによるこうした環境への適合
を可能にするため、順序コードとして知られる値が生成
されている。入力方法では、圧縮式を使用して文字コー
ドが圧縮される。次いで、圧縮コード及び順序コードの
探索用データを含む入力方法システム参照ファイルが参
照され、圧縮コードに対応する順序コードを発見するた
めの計算(順序コード初期値の加算)が実行される。こ
れらの順序コードは、各文字フォントファイルに格納さ
れた文字の順序を示している。順序コードが取得される
と、図10が示すように、文字を検索するための文字フ
ォントファイルの読み取りが可能になる。さらに、文字
の形状による分解を基礎とする入力方法の中には、幾つ
かの文字について構成されたコードセットが独自的でな
いものがある。このため、異なる文字が同一のコードグ
ループを有する場合がある。従って、本発明によるオン
ライン手書き漢字認識装置は、こうした事情を考慮して
後処理を実行する。
【0018】図4は、比較器部400による比較オペレ
ーションのフローチャートを記述している。比較器部4
00は、ステップS401で、比較のためにバッファ領
域700から文字形式分解部300によって出力された
基本部首コードを検索する。ステップS402では、T
sang Chi入力方法で使用される圧縮式に従っ
て、基本部首コードの圧縮が実行される。その後、ステ
ップS403で入力方法参照部450が参照され、圧縮
コードとの差が限界値T以下である文字順序コードが発
見される。ステップS404では、2つ以上の順序コー
ドを発見できるかどうかが決定される。イエスであれ
ば、ステップS405で、順序コードに対応する文字が
認識結果として文字フォントファイルから出力される。
2つ以上の文字の順序コードが発見された場合は、後処
理部500による後続の後処理オペレーションのため
に、候補文字の順序コードがバッファ領域700に格納
される。
【0019】図5を参照すると、ステップS501で、
候補文字を形成する部首セットの画数の特徴がバッファ
領域700から入力される。その後、ステップS502
で、後処理部500がまず、手書き文字の各部首を構成
する画数を圧縮するための基数として数字5を使用す
る。ステップS503では、候補文字の合計画数及び圧
縮後の画数値が除外文字記述部550の内容と比較さ
れ、最も差異が小さい候補文字が発見される。ステップ
S504では、文字の順序コードに対応する文字フォン
トファイル内の文字が、認識結果として出力部600に
出力される。
【0020】次の例では、漢字「抓」をオンラインで手
書きし、図3の文字形状分解工程フローチャート、図4
の文字比較工程フローチャート及び図5の文字後処理フ
ローチャートを参照して、本発明のオンライン手書き漢
字認識装置の基本的オペレーション処理について説明す
る。従来のTsang Chi入力方法に於ける基本部
首、派生部首、コード検索規則、コード圧縮方法及びそ
の他の関連原則が、本実施例の背景として機能してい
る。
【0021】入力部100を使用して手書き漢字「抓」
が入力されると、ステップS202で、前処理部200
による標準化及びライン希薄化が実施される。ステップ
S203では、漢字分離技術を使用して、漢字が左右の
2単体、「才」及び「爪」、に分離される。ステップS
204では、文字の各字画の方向及び長さの特徴、及び
字画間の交差関係の特徴が抽出される。こうした特徴
は、ステップ205でバッファ領域700に格納され
る。
【0022】続いて図3を参照すると、ステップS30
1で第1画「ー」の特徴がバッファ領域700から検索
される。ステップS302では、部首テンプレート特徴
記憶部350(図6参照)が参照されて、画数が1であ
る部首テンプレートの特徴と比較され、最も類似度の高
い部首「ー」が取得される。ステップS303では、部
首「ー」のコード(例えば13)が、バッファ領域70
0の第1画「ー」のデータ記録位置に格納される。これ
は第1画であって先に他の字画が検分されていないた
め、ステップS304乃至309を実施する必要はな
い。工程フローは再度ステップS301に進み、バッフ
ァ領域700から第2画「|」の特徴が検索される。ス
テップS302では、部首テンプレート特徴記憶部35
0が参照され、字画数が1である部首テンプレートの特
徴と比較され、最も類似度の高い部首「|」が取得され
る。ステップS303では、当該部首が派生部首である
ため、部首「|」の部首コード及びその基本部首コード
(例えば27、12)が、バッファ領域700の第2画
「|」のデータ記録位置に格納される。次にステップS
304で、第2画がこれと交差する第1画(「ー」)と
結合される。ステップS305では、部首テンプレート
特徴記憶部350が再度参照されて、結合された文字形
状「十」と字画数が2である部首テンプレートの特徴と
が比較され、最高の類似度を有する部首「十」が取得さ
れる。ステップS306では、「十」のコード(例えば
10)が、バッファ領域700の第2画「|」及び第1
画「ー」のデータ記録位置に格納される。ステップS3
07乃至S309では、結合された字画及び事前に検査
されたその他の字画から形成可能な部首が発見され、バ
ッファ領域700に記録される。図9は、全字画につい
て実行した上述のステップによって発見された部首セッ
トのリストを示したものである。
【0023】全ての字画が検査されると、ステップS3
11に於いて、図9が示すバッファ700に記録されて
いる各字画の部首セットのリストから、各字画について
大部分の字画数から形成される部首が、以下のように字
画入力順序に従って発見される:「才」(基本部首は
手、合計字画数は3)、「才」(手、3)、「才」
(手、3)、「厂」(竹、2)、「厂」(竹、2)、
「|」(中、1)、「\」(人、1)。ステップS31
2では、「抓」が左右の単体に分離可能であることか
ら、Tsang Chiコード検索規則に基づいて、
「才」が文字の左側部分として最初に検索される。これ
は基本部首「手」に属しており、その基本部首コードは
17である。文字の右側の3つのコード、「´」、
「/」、「\」、が検索される。これらはそれぞれ基本
部首「竹」、「中」、「人」に属しており、基本部首コ
ードはそれぞれ8、12、15である。最後に、ステッ
プS313で、基本部首コード17、8、12、15が
バッファ領域700に格納される。
【0024】ステップS401では、比較器部400
が、文字形状分解部300からコードを検索して比較す
る。ステップS402では、Tsang Chi方法で
採用されている圧縮式を使用して基本部首コードが圧縮
される。圧縮コード=17×274+12×273+15
×272+8×27+0。ステップS403では、圧縮
コードを使用して入力方法参照部450を参照し、計算
(順序コード初期値の加算)を実行することによって、
圧縮コードが限界値Tより下の値だけ異なる2つの漢
字、「抓」及び「掀」、の順序コードが発見される。ス
テップS404では、複数の順序コードの発見が決定さ
れ、2つの順序コードが後処理オペレーションのために
後処理部500に出力される。
【0025】ステップS502では、後処理部500
が、13を基数として使用し、各部首を構成する画数を
圧縮する。画数はそれぞれ3(手...「才」)、2
(竹...「厂」)、1(中...「|」)、1
(人...「\」)である。圧縮後の値Fは3×134
+2×133+1×132+1×13+0である。その後
ステップS503で、値F及び手書き漢字の合計字画数
(7)が除外文字記述部550の「抓」及び「掀」のそ
れと比較され、「抓」が最も平均差の少ないものである
ことが決定される。最後に、ステップS504で、文字
フォントファイルに於ける「抓」の順序コードに対応す
る文字が、認識結果として出力部600で出力される。
【0026】先述の実施例に使用されたTsang C
hi入力方法は、本発明の環境の一形態に過ぎない。本
発明は、この先述の実施例に限定されるものではない。
入力方法は、漢字形状による分解に基づくものであれば
本発明の好適な環境として使用可能である。本発明で
は、入力方法に於ける部首が、漢字を分解する際の部首
テンプレートとして使用される。入力方法に於いて使用
されるコード検索規則及びコード圧縮式については、部
首による分解技術及び比較オペレーションが変わらない
限り、実行に際して改造が可能である。
【0027】Tsang Chi入力方法に包含される
全ての文字を可能な認識パーティとした場合、Tsan
g Chi部首に基礎を置く本発明のオンライン手書き
認識装置を使用すると、本技術を採用した手書き漢字の
判読は、92%を越えるまでの認識効率を有することが
できる。本発明は、従来のTsang Chiコードを
使用して部首間の関係性を提示するため、データベース
空間を低減させる多数の漢字ペンインクテンプレートを
認識用として格納する必要がない。
【0028】本発明を最も実用的で好適な実施例とされ
るものに関連して説明してきたが、本発明は、開示され
た実施例に限定されるものではなく、最も広義な解釈に
よる精神と範囲内にある様々な装置を包含し、こうした
全ての改造及び同等装置を含めるように意図されている
ことが理解される。
【図面の簡単な説明】
【図1】 本発明による好適な実施例のシステムブロッ
ク図である。
【図2】 本発明による好適な実施例の前処理部の工程
フローチャートである。
【図3】 本発明による好適な実施例の文字形状分解部
の工程フローチャートである。
【図4】 本発明による好適な実施例の比較器部の工程
フローチャートである。
【図5】 本発明による好適な実施例の後処理部の工程
フローチャートである。
【図6】 本発明による好適な実施例の部首テンプレー
ト特徴記憶部の構造を示す略図である。
【図7】 本発明による好適な実施例の入力方法参照部
の構造を示す略図である。
【図8】 本発明による好適な実施例の除外文字記述部
の構造を示す略図である。
【図9】 文字「抓」が本発明による好適な実施例によ
って分解された後に取得された文字部首セットを示して
いる。
【図10】 本発明の好適な実施例による、入力方法文
字コードと順序コードとの間の関係を示した略図であ
る。
【図11】 本発明の好適な実施例による5グループの
文字分類を示している。
【図12】 24のTsang Chi基本部首と、7
4の派生部首と、10の複合部首とを含む、本発明の好
適な実施例による部首テンプレートセットを示してい
る。
【図13】 先行技術による実施例のモデルボード確立
部を示したブロック図である。
【図14】 先行技術による実施例の認識システム部を
示したフローチャートである。
【符号の説明】
100…入力部、 200…前処理部、 300…文字
形式分解部、350…部首テンプレート特徴記憶部、
400…比較器部、450…入力方法参照部、 500
…後処理部、 550…除外文字記述部、600…出力
部、 700…バッファ領域。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 データを一時的に格納するためのバッフ
    ァ領域と出力部とを有するオンライン手書き漢字認識装
    置であって、 文字形状による分解を基礎とする入力方法によって定義
    された基本部首または派生部首の形状的特徴を含む部首
    テンプレート特徴記憶部と、 文字の形状による分解に基づく従来の入力方法を基礎と
    し、文字圧縮コード及び順序コード探索情報のための入
    力方法システムデータファイルを含む入力方法参照部
    と、 除外漢字の特徴を記録して、候補漢字の中から最終の認
    識結果を決定する際に後処理部を補助するための除外文
    字記述部と、 従来型のオンライン文字手書き装置のデジタル化タブレ
    ットとペンとを含む入力部と、 入力された手書き文字に対して標準化及びライン希薄化
    処理を行ない、バッファ領域への格納のために文字認識
    に必要な特徴を抽出するための前処理部と、 前処理部によって抽出された手書き文字の特徴をもとに
    部首テンプレート特徴記憶部を参照して文字を分解し、
    手書き文字を形成している可能性のある部首を発見する
    ための文字形状分解部と、 文字形状分解部によって発見された構成部首と入力方法
    参照部の内容とを比較し、限界値より下の差分値を有す
    る候補文字を取得するための比較器部と、 候補文字の中から、手書き文字の他の特徴をもとに除外
    文字記述部の内容を参照して最終的な認識結果を決定
    し、最終認識結果を出力部に転送して出力するための後
    処理部と、を備えたオンライン手書き漢字認識装置。
JP11302466A 1998-10-26 1999-10-25 オンライン手書き漢字認識装置 Pending JP2000200323A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11302466A JP2000200323A (ja) 1998-10-26 1999-10-25 オンライン手書き漢字認識装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP30378098 1998-10-26
JP10-303780 1998-10-26
JP11302466A JP2000200323A (ja) 1998-10-26 1999-10-25 オンライン手書き漢字認識装置

Publications (1)

Publication Number Publication Date
JP2000200323A true JP2000200323A (ja) 2000-07-18

Family

ID=26563116

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11302466A Pending JP2000200323A (ja) 1998-10-26 1999-10-25 オンライン手書き漢字認識装置

Country Status (1)

Country Link
JP (1) JP2000200323A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011128687A (ja) * 2009-12-15 2011-06-30 Fujitsu Ltd 字形要素判定装置及び字形要素判定方法
CN112508108A (zh) * 2020-12-10 2021-03-16 西北工业大学 一种基于字根的零样本汉字识别方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011128687A (ja) * 2009-12-15 2011-06-30 Fujitsu Ltd 字形要素判定装置及び字形要素判定方法
CN112508108A (zh) * 2020-12-10 2021-03-16 西北工业大学 一种基于字根的零样本汉字识别方法
CN112508108B (zh) * 2020-12-10 2024-01-26 西北工业大学 一种基于字根的零样本汉字识别方法

Similar Documents

Publication Publication Date Title
EP1052593B1 (en) Form search apparatus and method
US6389166B1 (en) On-line handwritten Chinese character recognition apparatus
US7778464B2 (en) Apparatus and method for searching for digital ink query
JP2713622B2 (ja) 表形式文書読取装置
JP3452774B2 (ja) 文字認識方法
KR100487386B1 (ko) 부수 모델에 기초한 초서체 한자 수기 주석의 검색법
US6917708B2 (en) Handwriting recognition by word separation into silhouette bar codes and other feature extraction
JP2000200323A (ja) オンライン手書き漢字認識装置
JP2002063548A (ja) 手書き文字認識方法
WO1999041681A1 (fr) Procede d'analyse de structure d'image de document
JP2001331764A (ja) 文字認識方法
JP2842263B2 (ja) 住所読み取り装置
JP2550012B2 (ja) パタ−ン切り出し及び認識方法
Yin et al. Lexicon-driven recognition of one-stroke character strings in visual gesture
Leishman Shape-free statistical information in optical character recognition
JP2746345B2 (ja) 文字認識の後処理方法
JP2001092924A (ja) パターン認識方法および装置
JP3151866B2 (ja) 英文字認識方法
CN115439867A (zh) 一种基于多行文本的动态解析方法
JPH06231310A (ja) 文字認識装置における文字認識方法
JPH06111079A (ja) 単語読み取り装置
JPH07104940B2 (ja) 図形認識装置
JP2001216471A (ja) オンライン手書き漢字認識装置
Han A Coarse Classification Scheme on Printed Chinese Characters by Encoding the Feature Points.
JPH0348379A (ja) 文字認識方式