JP3344062B2

JP3344062B2 - カタカナ手書き文字切り出し回路

Info

Publication number: JP3344062B2
Application number: JP4935194A
Authority: JP
Inventors: 悦伸堀田; 聡直井
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1994-03-18
Filing date: 1994-03-18
Publication date: 2002-11-11
Anticipated expiration: 2017-11-11
Also published as: JPH07262314A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、手書き文字認識装置に
おける手書き文字切り出し回路に関する。近年、手書き
用の入力周辺機器として、手書き文字認識装置ＯＣＲの
需要が増加している。

【０００２】該手書き文字認識装置において、個々の文
字の高い認識率を実現する為には、認識の前段階である
手書き文字の切り出し処理が、その正確さの点で重要に
なる。

【０００３】これまで、帳票等において指定した位置に
文字が正しく書かれたものに対しては、高い精度で認識
することができた。然し、文字枠のないフリーピッチ領
域に書かれた文字や、指定文字枠に接触したり，大きく
はみ出した文字に対しては、１文字ずつ正確に切り出す
技術がなかったために、認識率が低下する問題が生じて
いた。

【０００４】従って、該フリーピッチ領域におけるカナ
文字のセグメンテーション，数字のセグメンテーション
手法の改善が必要となる。又、指定文字枠と入力文字列
の重なり度の評価法が必要となる。

【０００５】尚、これらの技術は、上記手書き用文字認
識装置だけでなく、印刷文字認識装置，図面認識におけ
る文字の切り出し等、広い意味での手書き文字の切り出
し技術にも関係する。

【０００６】

【従来の技術】図１３〜図１４は、従来の手書き文字の
切り出し回路を説明する図であって、図１３は、全体の
構成例を示し、図１４は、従来の文字切り出し方法を概
念的に示した図である。

【０００７】従来の文字切り出し方法としては、特開平
０４−０９８４７７号公報「文字の切り出し方法」に開
示されている方法｛図１３(a) 参照｝、例えば、文字の
統合，切り出しを行う際、図１４(a) に示されているよ
うに、文字列に対して縦方向の投影をとり、その白画
素, 黒画素の間隔を基に、統合を行う方法がある。

【０００８】又、文字列に対して求めた平均サイズと,
平均ピッチから文字間ピッチの分散が最小となるよう
に、切り出し間隔の分散最小評価基準に基づく動的計画
法により、統計的に文字の切り出しを行う手法として、
「 "分散最小基準に基づく適応型文字分離方式",辻善
丈, 浅井紘, 電子通信学会論文誌,'85/8VOL.J68-D,No.
8」がある。

【０００９】又、文字の切り出しが可能な組み合わせに
対して、それぞれ、認識処理を施し、その結果、最も認
識における評価値が高いものを選択する手法として、
「 "走書き文字列認識における文字切り出しの個人適応
化",村瀬洋, 電子情報通信学会論文誌、D-II,VOL.J72-D
-II,No.1,pp132-139,1989 年１月」がある。この手法
｛図１３(b) 暫定切り出し部, 切り出し候補設定部, 認
識処理を用いた切り出し評価部を参照｝は、文字の切り
出し位置の可能性を重み付きグラフで表現した後、その
グラフの探索により、認識率の良い切り出し位置を最終
決定する候補ラティス法｛図１４(c) 参照｝に基づいた
ものである。

【００１０】又、数字の切り出し方法については、例え
ば、本願出願人が先願している、特願平05-140428 号
「文字の切り出し方法及びその装置」があり、この手法
では、ラベリング処理で別のラベルを持つ分離文字から
生じる分離ストロークの角度と、それを統合したときの
サイズを評価して、数字の切り出しを行う方法である。

【００１１】上記数字の切り出し手法では、後述の図７
(a1),(a2) に示されているようにして、上記数字の切り
出しが行われると、字種データ格納部(0) に、該切り出
し文字が数字であることを指示するフィールド情報と、
該数字の文字枠の座標を指示するフィールド情報が格納
される。従って、以降での文字切り出し手法では、上記
字種データ格納部(0) の数字であることを示すフィール
ド情報に基づいて、数字に固有な統合処理が行われる。

【００１２】

【発明が解決しようとする課題】前述のフリーピッチ領
域に書かれる文字列の中には、文字同士が近接して書か
れる場合が存在する。そのような場合、前述の投影を使
用する方法や、単に、文字列の統計的情報だけを使って
文字の統合／分離をしていく方法では、図１４(a) に示
されているように、例えば、ある文字の分離ストローク
が、隣のストロークと間違って統合される場合があっ
た。

【００１３】又、図１４(c) に示されているように、統
合可能な候補ラティスの組み合わせの距離値を計算し
て、認識評価していく方法では、文字の正確な切り出し
は可能であるが、各組み合わせについての複数回の認識
処理が必要となり処理時間がかかるため、文字切り出し
処理の高速性の点で問題があった。

【００１４】又、上記分離ストロークに着目した数字の
切り出し方法では、統合先のストロークの特徴を見てい
なかった為、上記図７(a1) に示されているように、
「７」として統合すべき分離ストロークを、右側の数字
「１」に誤って統合してしまうという問題があった。

【００１５】本発明は上記従来の欠点に鑑み、カタカ
ナ手書き文字に特有な特徴知識を導入することにより、
手書き文字切り出し回路において、処理時間を短くし
て、正確に文字の切り出しを行うことができるカタカナ
手書き文字の切り出し回路を提供することを目的とする
ものである。

【００１６】

【課題を解決するための手段】図１，図２は、本発明の
原理構成図であり、図３〜図９は、本発明の原理説明図
である。上記の問題点は下記の如くに構成した手書き文
字の切り出し回路によって解決される。

【００１７】手書き文字の切り出し回路であって、前処
理部 0で、通常の文字か、数字かを判別すると共に、１
文字列中の字数が少ない場合と、１文字列中の字数が多
い場合とに場合分けして、ラベリング処理(1a,1b) 1,外
接矩形仮統合部(2a,2b) 2,平均文字サイズ算出部(3a,3
b) 3 に入り、ラベリング処理 1で求めた連結情報を基
づいて、部分パターンに外接する矩形を抽出し、該抽出
された矩形に対して、暫定的に近傍の矩形同士を、その
矩形統合が正方性を保つ範囲で仮統合する、外接矩形仮
統合手段 2と、上記統合された各矩形に対して、平均文
字サイズを算出する平均文字サイズ算出手段 3と、上記
算出した平均文字サイズと、所定の方法で求めた文字列
軸を基に、該文字列軸の上方に位置する小矩形を抽出す
る小矩形抽出手段 4と、該抽出した小矩形が隣接して２
つ存在する場合に、それを濁点候補として抽出し、該抽
出された濁点候補に対して、上記隣接している２つの小
矩形の並び方を複数通り、例えば、６通りに分類する濁
点抽出手段 5,5a と、上記抽出された小矩形の中から線
密度情報を基に、続け字濁点，半濁点を抽出する続け字
濁点・半濁点抽出手段 6と、小矩形以外のものから位
置, サイズ, 線密度情報を基に、サイズの大きい半濁点
の候補を抽出する半濁点抽出手段 8と、該半濁点とされ
たものに対し、その全体に対する空白領域の占める割合
いによって半濁点らしさを評価する手段 11 と、上記濁
点候補抽出手段５によって、濁点候補と判定されたも
のに対して、その右に位置するストロークの形状を判定
し、該濁点候補が「シ」「ツ」「ウ」の部分パターンか
どうか判定し、上記「シ」「ツ」「ウ」を抽出する手段
9,10 と、上記濁点候補の内、上記濁点抽出手段 5,5a
で分類された所定の小矩形の並び方のものを濁点と判定
し、以後の文字切り出し処理において、一時的に除外
し、同様に、上記半濁点らしさを評価する手段 11 によ
って、半濁点らしさの程度の高いものを、例えば、フラ
グを付加して一時的に除外する濁点・半濁点一時的除去
手段 12 と、上記平均文字サイズをもとに、近傍の外接
矩形同士を統合する近傍統合手段 13 と、上記部分パタ
ーンの内の右上がりのストローク線分を抽出したのち、
その右に位置するパターンに対して線密度判定から、そ
れらの２つストロークが「ル」「ハ」かどうかを判定す
る「ル」「ハ」の抽出手段 14 と、上記の各処理におい
て、未統合の小ストロークに対して、その外形矩形の位
置, 縦横比, 方向性情報を基に、その左右に位置するス
トロークに統合する小ストローク統合手段 15 と、文字
の並びの直線性, 矩形サイズの変動パターンを基に、未
統合のストロークを統合していく小ストローク統合手段
16 と、上記一時的除外手段 12 で除外されている、フ
ラグの付加されている濁点, 半濁点を統合する手段 17
とを備えるように構成する。

【００１８】つまり、最初に、手書き文字、特に、カナ
文字の切り出しを難しくしている濁点, 半濁点の候補
を、最初に抽出し、その際、「シ」「ツ」「ウ」などか
ら、その部分パターンが濁点と間違って抽出されないよ
うに、該「シ」「ツ」「ウ」の抽出を行い、ここで、以
降での文字の切り出しを容易にする為、濁点, 半濁点と
識別されたものに対して、フラグを付けて一時的に除去
した上で、カナの分離文字を統合するため、該分離文字
の平均文字サイズを基に、ストローク外接矩形の矩形間
距離の近いもの同士の近傍統合を行い、横方向に分離し
た文字である「ハ」「ル」の抽出処理を行い、この段階
で、上記平均文字サイズより小さく、文字列の上方に位
置する小ストロークがあると、それを抽出して、右のス
トロークと統合し、該文字列の下方に位置するストロー
クについては、その方向性, 左右のストロークとの位置
関係をもとに、統合処理を行い、最後に、文字列中の文
字の並びを見て、サイズ, ピッチの変動が少なくなるよ
うに小ストロークの統合を行い、上記フラグを付加して
除去しておいた濁点, 半濁点の統合を行うように構成す
る。

【００１９】

【作用】以下、図１, 図２を参照しながら、図３〜図９
によって、本発明の手書き文字切り出し回路の作用，動
作を説明する。

【００２０】本発明の対象となる文字パターンは、極端
な傾きや回転の補正を行い、雑音の除去を行い、かすれ
文字については、かすれの穴埋め等の前処理後の２値画
像である。又、文字同士のオーバーハングはあっても文
字同士の重なり，接触，続け字はないものとする。

【００２１】先ず、個々のストロークを区別するため、
ラベリング 1では、８連結で繋がっているパターンをラ
ベリング処理によりにより抽出する。具体的には、８連
結のウインドウパターンで文字パターンを走査して、該
ウインドウパターンで走査できた画素に、所定の論理に
基づいて、同じラベルを与える。このとき、該ラベリン
グで得られた部分パターンのサイズが後で問題となるの
で、該部分パターンの最小隣接矩形の座標抽出（左上と
右下）も、上記ラベリング処理で同時に求めておく。

【００２２】上記ラベリング処理の詳細については、
「“画像処理の基本技法（技術入門編)(Image Processi
ng on Personal Computer)",第１部画像処理の基礎，第
３章画像処理の基本アルゴリズム,ii)連結成分処理,
ラベリング, 長谷川純一, 興水大和, 中山晶, 横中茂樹
著, 技術評論社, 昭和６１年８月１０日刊」に詳しい。

【００２３】上記カナの切り出しにおいて、濁点，半濁
点は、それ自体一文字とならず、又、他の文字にオーバ
ーハングして書かれたりするため、文字の切り出しの際
に問題となる。そこで、先ず、文字列の中から、濁点，
半濁点を抽出するようにする。該濁点，半濁点の抽出に
は、平均文字サイズと位置を用いる。以下、図３〜図９
によって各処理について、その作用動作を説明する。

【００２４】(1) 外接矩形仮統合と平均文字サイズ算
出：始めは、１文字ずつが切り出されていないので、厳
密には、正確な平均文字サイズを求めることができな
い。そこで、本発明においては、図３(a) に示されてい
るように、目安として、図１に示した外接矩形仮統合手
段 2で、暫定的に平均文字サイズを算出する。そのため
に、上記ラベリング 1で得られた各外接矩形について、
近接するもの同士を仮統合していく。このときの統合基
準としては、各矩形を統合したときの縦横比Ｐが、Ｎ(=
0.8)＜Ｐ＜Ｍ(=1.2)を満たす場合とする。該仮統合処理
の後、平均文字サイズ算出手段 2において、各矩形に対
して、平均文字サイズを算出する。該平均文字サイズ
は、例えば、上記各矩形のサイズ別の頻度ヒストグラム
をとって求めるようにしても良い。

【００２５】本発明においては、文字列の大体の平均
サイズを求めるのに、上記統合矩形の縦横比Ｐだけを、
矩形仮統合の基準としているので、高速な統合処理が可
能となる。 (2 ) 小矩形抽出：図３(b) は、小矩形抽出の原理を示
している。先ず、本願出願人が先願している前述の特開
平05-140428 号「文字の切り出し方法及びその装置」で
開示している重み付け投影により、図１の小矩形抽出手
段 4において、文字列軸を求め、該文字列軸と、上記平
均文字サイズとから、濁点, 半濁点の候補となる小矩形
を抽出する。具体的には、文字列軸の上方に位置し、平
均サイズに対するサイズ比が、ある閾値、例えば、上記
平均文字サイズの 1/4程度以下になるものを小矩形とし
て抽出する。

【００２６】従って、矩形の位置，サイズ情報とも
に、予め、設定した固定の値を用いるのではなく、文字
列の位置やサイズの変動に応じて計算した平均文字サイ
ズ，文字列軸を用いるので、より正確な小矩形の抽出が
可能となる。 (3 ) 濁点, 半濁点抽出：図３(c) は、濁点, 半濁点抽
出手段の原理を示している。上記小矩形手段 4で抽出し
た小矩形が２つ隣接する場合、それらを統合したサイズ
の、上記平均文字サイズに対する比が、ある閾値、例え
ば、1/4 以下であると、上記図１の濁点候補抽出手段 5
で、濁点候補として抽出する。更に、該小矩形が１つだ
け存在するときは、それが続け字濁点，半濁点かどうか
を、続け字濁点・半濁点抽出手段 6で、縦横方向の線密
度, 又は、輪郭線の特徴を基に識別する。

【００２７】具体的には、縦方向の線密度≧２，又は、
横方向の線密度≧２のものを、続け字，或いは、半濁点
として抽出する。又、上記輪郭線の特徴を見るのに、該
濁点, 半濁点候補の文字パターンの輪郭線を、例えば、
該文字パターン上の微分線の角度を縦軸に、その位置を
横軸にプロットして、その輪郭線の特徴を見ることによ
り、続け字濁点, 半濁点を識別する。尚、ここで、線密
度は、黒画素を横切る回数を言う。

【００２８】つまり、濁点としてのまとまりを一度に
抽出するのではなく、個々の小矩形を抽出した上で、そ
のまとまりを濁点候補とすることで，サイズ的に大き
く、比較的に離れた位置に書かれた濁点なども、正確に
抽出することができる。又、線密度処理だけで、続け字
濁点, 半濁点を識別するため、高速な識別が可能とな
る。更に、ストロークの輪郭線をもとに、該続け字濁
点, 半濁点を識別するため、正確な識別が可能となる。
又、半濁点抽出手段 6を、濁点候補抽出手段 5とは別に
設けることで、濁点に比べ、大きく書かれやすい半濁点
を正確に抽出することができるようになる。 (4 ) 濁点候補の配置分類：図４(a1)は、濁点候補の配
置分類の例〜を示している。上記濁点候補抽出手段
5で濁点候補とされたものの中には、濁点以外に、他の
文字の部分パターン (分離ストローク) も含まれてい
る。そこで、本発明では、濁点と、それ以外の分離スト
ロークとを判別する際の目安として、濁点を、その２点
の位置関係より、図４(a1)に示したように、例えば、分
類番号〜で示した６通りに分類する。

【００２９】図４(a2)に示した文字列の例では、各濁
点は、左から順に、上記の分類パターンでは、それぞ
れ、，，，の分類番号に対応する。一般に、濁
点候補の中には、「ツ」「シ」などの部分パターンを含
まれているので、上記のように、濁点の配置を判定する
ことで、その識別がより容易となる効果がある。 (5 ) 半濁点抽出：図４(b),(c2)は、半濁点の抽出例の
原理を示している。上記濁点候補抽出手段５で抽出さ
れた濁点に比較して、半濁点は、一般的に大きめに書か
れていることが多い。そのため、前記の小矩形抽出手段
4で抽出されない、半濁点が存在することになる。そこ
で、本発明では、半濁点抽出手段 8において、サイズが
上記小矩形より大きく、文字平均サイズより小さいもの
に対して、その位置, 線密度を算出し、半濁点かどうか
を判別する。

【００３０】具体的には、そのサイズが、文字平均サイ
ズの 2/3以下のものを抽出し、縦方向, 横方向の線密度
≧２であって、上記文字列軸より上に存在する文字パタ
ーンを半濁点とする。

【００３１】上記の処理では、主として、線密度の処
理だけで、続け字濁点, 半濁点を識別するため、高速な
識別が可能である。 (6 ) 半濁点らしさの評価：図４(c1)〜(c3)は、半濁点
らしさの評価の原理を説明したものである。即ち、上記
半濁点抽出手段 6,8で、半濁点として抽出されたものの
中で、くずれ字の半濁点と文字の部分パターンで丸みの
もつものとの区別がつけ難い。そこで、本発明では、半
濁点らしさ評価手段 11 を設け、そこで、外接矩形領域
の全体に占める空白領域の割合に応じて、半濁点らしさ
の度合いを、以下の方法で評価する。即ち、該部分パタ
ーンに対して、縦方向, 横方向の線密度を算出し、｛
(縦線密度が２以上の部分：ａ）／（外接矩形の縦長
さ：ｗ）｝×｛ (横線密度が２以上の部分：ｂ）／（外
接矩形の横長さ：ｈ）｝の値を求め、この値が“１”に
近いとき、半濁点とし、この値が“０”に近いとき、例
えば、図４(c2)に示されている続け字濁点のように、縦
の線密度＝１のときには、上記評価値が“０”となるこ
とから、このような場合には、半濁点としないようにし
たものである。

【００３２】従って、矩形全体に占める空白領域の割
合を評価することにより、半濁点と、それ以外のただ丸
くいるだけのストローク, 或いは、続け字濁点とを正確
に識別することができるようになる。 (7 ) 「ウ」の抽出：図５(a) は「ウ」を抽出する原理
を示した図である。

【００３３】上記濁点候補抽出手段 5等で抽出した濁点
候補に含まれる「ウ」の部分パターンを抽出する為に、
本発明においては、上記濁点候補の中で、上記図４(a1)
で示した濁点候補分類パターンの内、，，，に
分類されるものについて、その右に位置するストローク
の線密度を算出する。該算出した線密度が (縦方向,横
方向) ＝(2,1) となれば、それらの濁点候補を「ウ」の
部分パターンとして抽出する。該線密度が (縦方向, 横
方向) ＝(1,1) であると、「ツ」「シ」の部分パターン
の候補とする。

【００３４】このように、濁点候補の右に位置するス
トロークを調べることで、その中に含まれる「ウ」の部
分パターンを抽出することができ、より正確な切り出し
が可能となり、更に、線密度, 角度を用いて、該右のス
トロークを調べることで、より高速な処理が可能とな
る。 (8 ) 「シ」「ツ」の抽出：図５(b) は、「シ」「ツ」
を抽出する原理を示した図である。

【００３５】上記濁点候補抽出手段 5等で抽出した濁点
候補に含まれる「シ」「ツ」の部分パターンを抽出する
ため、本発明においては、その右に位置するストローク
の線密度を調べ、該線密度が (縦方向, 横方向) ＝(1,
1) となった、「ツ」「シ」の右側の直線性を持つスト
ロークについて、更に、その角度を調べ、角度が、例え
ば、40度を持つ右上がりであれば、「シ」「ツ」として
抽出する。

【００３６】このように、濁点候補の右に位置するス
トロークを調べることで、その中に含まれる「シ」
「ツ」の部分パターンを抽出することができ、より正確
な切り出しが可能である。又、線密度, 角度を用いて、
該右のストロークを調べることで、より高速な処理が可
能となる。 (9 ) 濁点の一時的除去処理：上記濁点候補抽出手段 5
で分類された濁点候補の中で、上記「ウ」抽出手段 9,
「シ」「ツ」抽出手段 10 で、「ウ」「シ」「ツ」に統
合されなかったものに対して、分類番号，，，
に分類されるものを濁点と判定したもの、又、上記半濁
点抽出手段 6,8で、半濁点候補とされたものに対して、
上記半濁点らしさ評価手段 11 で、半濁点らしさの度合
いの大きいものに対して、以後の文字切り出し処理での
文字切り出しを容易にする為に、濁点, 半濁点の一時的
除去手段 12 において、所定のフラグを付加して、一時
的に除去する。

【００３７】このように、濁点, 半濁点を一時的に除
去することにより、サイズやピッチの計算を行う際に、
より正確な値を求めることが可能となる。又、濁点, 半
濁点は隣の文字に統合され易いので、上記のように、一
時的に除去しておくことで、より正確な文字の切り出し
が可能となる。 (1 0)近傍統合：図５(c1),(c2) は、近傍統合の原理を
示した図である。上記濁点候補抽出手段５で抽出さ
れ、分類番号，に分類されたものを除き、各外接矩
形間の距離の近いもの同士を統合する。このときの距離
としては、外接矩形の中心間の水平方向の距離を考え
る。それらを統合したとき、統合後のサイズが、サイズ
平均, ピッチ平均, ピッチ分散から定まるサイズの上限
を越えなければ、それらを統合する。

【００３８】具体的には、図５(c2)に示されているよう
に、濁点候補の小矩形の中心と、右のストロークの外接
矩形の中心との距離をａとし、該小矩形と外接矩形とを
統合したときのサイズをｂとし、平均文字サイズをｃと
し、上記統合後のサイズが、サイズ平均, ピッチ平均,
ピッチ分散から定まるサイズの上限をｄとしたとき、ａ
＜ｃ／２，ｂ＜ｄの条件を満たすものを近傍統合する。
ここで、上記ｄとして、例えば、ｄ＝（サイズ平均／
２）＋ピッチ平均より求めるようにする。

【００３９】カナ文字の場合、分離文字が多いので、上
記の如き統合処理は不可欠であるが、矩形間の距離の近
いもの同士を統合しておくことで、より高速な文字切り
出しが可能となる。

【００４０】(11) 「ル」「ハ」の抽出：図６(a1),(a
2) は、「ル」「ハ」の抽出原理を示した図である。先
ず、近傍統合された文字列について、右上がりの直線分
(ストローク) をサイズ, 線密度情報, 角度を使用して
抽出する。次に、その右に位置するストロークに対し
て、複数方向線密度を調べる。その結果、複数方向線密
度＝２であると、それらの文字パターンを「ル」「ハ」
として抽出する。

【００４１】「ル」とされたものについては、２つのス
トロークの間隔，統合サイズと、平均文字サイズとの比
から、それが「ル」であるのか「ノ」＋「レ」であるか
を、以下の評価式で評価する。即ち、図６(a2)に示され
ているように、左側のストロークと右側のストロークと
の間の距離をａとし、両ストローク間の最大幅をｂと
し、上記平均文字サイズをｃとして、Ｒ＝α（ａ／ｂ）
＋β（ｂ／ｃ），但し、α，βはパラメータを算出し、
Ｒの値が小さいときには「ル」とし、該Ｒの値が大きい
ときには「ノ」＋「レ」であると判定する。

【００４２】このように、横方向に分離した文字に対す
る統合処理を入れておくことにより、正確な文字切り出
しが可能になる。又、「ル」「ハ」を同一の方法で処理
するため、高速な文字の切り出しが可能となる。

【００４３】又、ストロークの分離した分離文字であ
るか、又は、２つの独立した文字であるかを一意に決定
するのではなく、前述の評価式によって確率的に評価す
ることで、仮に、初めの決定が間違っていたとしても、
もう一方を考えることで、より正確な切り出しが可能と
なる。 (1 2)小ストローク統合：図６(b1),(b2) は、小ストロ
ークの統合方法の原理を示した図である。

【００４４】一般に、カナ文字においては、文字列軸の
上方にある分離ストロークは、その大半が、右の文字か
ら分離したものである。そこで、本発明においては、こ
こまでの文字切り出し処理で未統合の分離ストローク
で、文字列軸の上方にあるものを、位置・方向性による
小ストローク統合手段 15 で、その位置, 方向性, 外接
矩形の縦横比と、平均文字サイズを基に、その右のスト
ロークに統合する。図６(b1)では、上記小矩形抽出→近
傍統合→小ストローク統合(1) の処理方法を示してい
る。このようにして、例えば、「ワ」「ン」の分離スト
ロークを統合することができる。この小ストローク統合
(1) の方法では、小ストロークの右側に位置するストロ
ークの形状特徴だけに着目した統合処理であるため、高
速な統合が可能である。

【００４５】上記までの統合処理で、未だ統合されて
いない小ストロークが、例えば、図６( b2) に示したよ
うに存在している場合、文字並び・サイズ妥当性による
小ストローク統合手段 16 において、小ストロークが文
字列軸の下方にあること、文字並びの直線性, サイズの
妥当性をもとに、当該小ストロークを下方小分離ストロ
ークとして抽出し、これを図示されているように、その
左, 又は、右のストロークに統合する。図６(b2)の例で
は、右側の小ストロークに統合し、「ッ」を得た例であ
る。

【００４６】この小ストローク統合(2) の方法では、
文字列の全体の並びや, サイズの妥当性に着目すること
で、上記のような、ストロークの形状特徴や、その近傍
のストロークの特徴に着目するだけでは、統合できなか
ったストロークを正確に統合することができる。 (1 3)濁点, 半濁点の統合：図６(c) は、濁点, 半濁点
の統合原理を示した図である。上記(9) で、フラグを付
加して、一時的に除外しておいた濁点, 半濁点を、濁
点, 半濁点統合手段 17 において、左に位置するストロ
ークに統合する。

【００４７】このように、濁点, 半濁点の統合を、上
記の全ての統合処理の最後に行うことで、該濁点, 半濁
点の間違った統合を防ぎ、正確な文字切り出しが可能と
なる。 (1 4)「５」統合方法：図７(a1),(a2) は、数字の
「５」を切り出す方法の原理を示した図である。文字が
数字であるか否かは、前述の前処理 0での字種データ記
憶部 02 で、フィールド情報で、数字であることが示さ
れているので、そのフィールド情報を参照して数字であ
ることを認識して処理する以外、文字切り出しの全体的
な方法は、通常の文字と同じである。

【００４８】本願出願人が先願している、前述の特開平
05-140428 号公報「文字切り出し方法及び装置」で開示
している数字の切り出し方法においては、図７(a1)に示
されているように、分離ストロークを「５」として統合
する際、分離ストロークの角度と、該分離ストロークを
統合したときのサイズを評価するだけで、統合した左側
のストロークの特徴を見ていなかった。従って、図示さ
れている如くに、「67」「17」の文字列が正確に統合で
きていないことがあった。

【００４９】そこで、本発明においては、上記の如き統
合ミスの内、特に、頻度が高いのは「１」「６」が左に
ある場合であることに着目し、「１」「６」の左側のス
トロークの輪郭線が、両者とも、左側に凸になってお
り、「５」に関しては、該左側の分離ストロークは、逆
に、右側に凸になっていることに鑑みて、左側の輪郭線
が左に凸になっているものについては、分離ストローク
の統合を行わないようにし、該輪郭線の内、右側に凸に
なっているものに対して統合を行うようにする。

【００５０】図７(a2)は、このようにして、「５」の統
合を行った例を示している。このとき、分離ストローク
を抽出する際、小矩形抽出部 4で抽出した文字パターン
に対して、分離ストロークの線密度を算出し、縦方向と
横方向の線密度が“１”であるとき、分離ストロークと
するが、該ストロークの線密度を算出する前に、平滑化
フィルタをかけることで、該分離ストロークの細かい凹
凸を減少させることができ、上記線密度の算出精度を向
上させることができる。

【００５１】又、図１の平均文字サイズ算出手段 3で、
平均文字サイズを算出する際、上記字種データ記憶部 0
2 で算出した同一字種の複数の文字列に対する文字枠座
標 (左上と右下) からなる情報フィールドによって、複
数の文字列の文字枠を抽出し、該抽出した文字枠内の文
字列について、ラベリング処理 1a で、連結した数字の
パターンを求め、その文字パターンについて、外接矩形
統合部 2a で、複数の文字列を纏めて外接矩形を算出し
た後、各文字列毎の各文字に対して算出した外接矩形の
サイズの頻度ヒストグラムから、平均文字サイズを算出
することで、１文字列中の文字数が少ない場合におい
て、平均文字サイズを求める場合に比較して、正確な平
均文字サイズを求めることができる。

【００５２】このように、分離ストロークの形状だけ
ではなく、統合相手の特徴を調べることにより、正確な
文字切り出しができるようになる。又、その際、左側の
ストロークの輪郭線に着目することで、容易に、統合評
価を行うことができる。

【００５３】先ず、前処理部 0の文字列抽出部 01 での
ラベリング処理で、連結パターンに対するラベルを付加
し、該ラベルの付加された連結パターンについて、縦方
向の隣接投影 (縦方向のｉ−１列，ｉ＋１列の投影値を
ｉ列の投影値に加算する投影法）を行って、投影された
画素数が所定の数（閾値）より大きい部分の位置（列）
を文字枠列とし、同様に横方向の隣接投影を行って、投
影値が所定の数（閾値）より大きい値の位置（行）を文
字枠行として、該文字枠を形成している画素を除去｛上
記文字枠除去手段の詳細については、本願出願人が先願
している特開平05-168253 号「画像抽出装置」に詳しい
が、ここでは、その要点のみに限定して説明した｝し、
該除去された文字パターンについて、近傍の文字パター
ンの仮統合をして、仮統合された文字パターンの外接矩
形を求め、上記文字枠との重なりを評価する。

【００５４】具体的には、図８(b2)に示されているよう
に、上記抽出した文字枠の中心と、上記外接矩形の中心
との下位の距離を di とし、文字数ｎ，文字枠の幅をｗ
としとしたとき、Ｌ＝｛平方根（Σ di²：i=1 〜n)／ｎ｝／ｗを求めて、該算出したＬの値が“０”に近いとき、文字
列と文字枠との重なりはないが、該Ｌが“１”に近いと
き、文字列と文字枠とが重なっていると判断するもので
ある。

【００５５】通常、上記文字枠を除去した文字パター
ンについては、文字枠の除去で空白になっている画素を
補間する処理が必要となるが、文字枠と重なっていない
文字列については、該補間処理が不要となり、上記前処
理での文字列抽出部 01 での処理を高速化することがで
きる効果が得られる。 (1 6)投影を用いた粗密度評価：図９(c1),(c2) は、投
影を用いた粗密度評価の原理を示した図である。従来の
粗密度評価の手法は、本願出願人が先願している、前述
の特開平05-140428 号「文字の切り出し方法及び装置」
に詳しいが、要約すると、図９(c1)に示されているよう
に、ラベリングによって求めた外接矩形間の距離をピッ
チとして用いて、文字間の粗密度を評価していたため、
該ラベリング処理に時間がかかるという問題があった。
そこで、本発明においては、上記前処理部 0での文字列
抽出部 01 において、文字パターンの一次元投影によっ
て生じる黒画素間の間隔で、粗密度を評価するものであ
り、ラベリング処理を不要とすることで高速に文字列の
粗密度を評価することができる。文字列の粗密度が分か
れば、即、文字認識に入ることができるので、この場合
には、前処理以降での一連の文字切り出し処理を省略す
る事ができる。このように、本発明によれば、カナ文字
列中から濁点, 半濁点だけを正確に抽出した後、それら
を一時的に除去しておくことにより、それらを間違って
隣の文字と統合することがなくなる。又、「ル」「ハ」
といった分離文字に対する処理を入れているため、正確
な切り出しが可能である。それ以外の文字を統合する場
合も、個々のストロークの位置, サイズ, 方向性といっ
た情報だけを見て、１文字として認識を行っていないの
で、高速で精度の高い文字切り出しが可能となる効果が
ある。

【００５６】

【実施例】以下本発明の実施例を図面によって詳述す
る。前述の図１，図２が、本発明の原理構成図であり、
図３〜図９が、本発明の原理説明図であり、図１０〜図
１２は、本発明の一実施例を流れ図で示した図であり、
図１０は、平均文字サイズから濁点，半濁点を抽出する
処理フローを示し、図１１は、「ウ」を抽出する処理フ
ローを示し、図１２は「シ」「ツ」を抽出する処理フロ
ーを示している。

【００５７】本発明においては、平均文字サイズから濁
点，半濁点を抽出する手段 4,5,6,8,11 と、「ウ」を抽
出する手段 9と、「シ」「ツ」を抽出する手段 10 が、
本発明を実施するのに必要な主な手段である。尚、全図
を通して同じ符号は同じ対象物を示している。

【００５８】以下、図１〜図９を参照しながら、図１０
〜図１２によって、本発明の文字切り出し回路の主要動
作を説明する。先ず、図１に示したラベリング 1で連結
パターンを抽出し、外接矩形仮統合手段 2で、該抽出さ
れた連結された文字パターンの仮統合を行う、該仮統合
された文字パターンについて、平均文字サイズ算出手段
3で、例えば、外接矩形のサイズの頻度ヒストグラムを
算出して、該外接矩形の平均サイズを算出する。｛図１
０の処理ステップ 100参照｝上記算出した平均文字サイズと、各外接矩形の文字列軸
とから、濁点, 半濁点の候補となる小矩形を、図１の小
矩形抽出手段 4で抽出するのに、その外接矩形の位置
が、上記文字列軸より上方にあって、外接矩形のサイズ
が、上記平均文字サイズの１／４以下であるかどうかを
見る。｛図３(a),(b),(c) 参照｝｛図１０の処理ステッ
プ 101参照｝外接矩形サイズが、平均文字サイズの１／４以下のもの
を小矩形として抽出し、次の濁点候補抽出手段５にお
いて、該抽出した小矩形が２つ隣接し、それらを統合し
たときのサイズが、上記平均文字サイズの、例えば、１
／４以下であるとき、その小矩形を形成している文字パ
ターンを濁点候補として抽出し、濁点配列の分類｛図３
(c),図４(a1)参照｝を行う。

【００５９】前述のように、上記濁点候補の中には、
「ツ」「シ」などの部分パターンが含まれていることが
あるので、上記のように、濁点の配置〜を判定する
ことで、図１での「シ」「ツ」の抽出手段 10 での、
「ツ」「シ」識別が容易となる。｛図１０の処理ステッ
プ 102,103,104,105参照｝該抽出した小矩形が２つ隣接し、それらを統合したとき
のサイズが、上記平均文字サイズの、例えば、１／４以
下でないとき、縦線密度と、横線密度とを算出して、そ
れぞれが“１”以上であるとき、続け字濁点，或いは、
半濁点候補として抽出するが、上記縦線密度と、横線密
度が“１”以下であるときには、その儘、続け字濁点，
或いは、半濁点の候補ではないとして、切り出し処理を
保留し、次の処理での文字切り出しを行うときに使用す
る。｛図３(c) 参照｝｛図１０の処理ステップ 103,10
6,107,108参照｝上記の処理ステップ 101で、外接矩形のサイズが、上記
平均文字サイズの1/4以下でないとき、処理ステップ 10
9で、平均文字サイズの1/4 以上であって、平均文字サ
イズの2/3 以下｛図４(b) 参照｝であるとき、縦方向と
横方向の線密度を算出し、それぞれが“１”以上である
とき半濁点候補とする｛図４(b),(c1),(c2) 参照｝が、
上記の条件を満たさない文字パターンに対しては、リジ
ェクトして、以降での文字切り出し処理で使用する。
｛図１０の処理ステップ 101,109,110,111参照｝次に、図１の原理構成図で示されている濁点抽出処理後
の「ウ」の抽出手段 9について、図１１の処理フローで
説明する。

【００６０】前述の図１０の処理ステップ 105で、濁点
の配列に分類したが、該分類した濁点候補の配列が、分
類番号が, , ，であるものを抽出する。｛図１
１の処理ステップ 200参照｝該抽出した濁点候補の右側のストロークの縦方向の線密
度＝２で、横方向の線密度＝１であるものを選択し、該
濁点候補と、その右側に、上記条件を満たすストローク
との統合サイズが、文字サイズの上限値以下であるもの
が抽出されたとき｛図５(a) 参照｝、その文字パターン
を「ウ」とする。上記の条件を満たさないものについて
は、ここでは、リジェクトして、以降での処理での文字
切り出しに使用する。｛図１１の処理ステップ 201,20
2,203参照｝次に、図１の原理構成図で示されている「ウ」の抽出手
段 9後で処理される「シ」「ツ」の抽出手段 10 につい
て、図１２の処理フローで説明する。

【００６１】前述の図１０で説明した濁点の処理で、処
理ステップ 104で抽出した濁点候補について、その右の
ストロークが縦, 横方向の線密度＝１で、その傾きが０
度から９０度以内の、例えば、４０度程度であって、該
濁点候補と、上記条件を満足する右のストロークとの統
合サイズが、文字サイズの上限値以下であるものを、
「シ」「ツ」として統合｛図５(b) 参照｝するが、上記
の条件を満たさない濁点候補については、ここでは、リ
ジェクトして、以降での処理での文字切り出しに使用す
るようにする。｛図１２の処理ステップ 300,301,302,3
03参照｝本発明による、他の文字の切り出し手段については、前
述の「作用」欄で、図３〜図７により、詳細に説明して
あるので、省略する。

【００６２】このように、本発明による文字切り出し回
路は、手書き文字、特に、カナ文字の切り出しを難しく
している濁点, 半濁点を、最初に抽出する際、「シ」
「ツ」「ウ」の部分パターンが濁点と間違って抽出され
ないように、該「シ」「ツ」「ウ」の抽出を行い、上記
抽出した濁点, 半濁点にフラグを付けて一時的に除去し
た上で、上記切り出した分離文字の平均文字サイズを基
に、ストローク外接矩形の矩形間距離の近いもの同士の
近傍統合を行い、横方向に分離した文字である「ハ」
「ル」の抽出処理を行い、この段階で、上記平均文字サ
イズより小さく、文字列の上方に位置する小ストローク
があると、それを抽出して、右のストロークと統合し、
該文字列の下方に位置する小ストロークについては、そ
の方向性, 左右のストロークとの位置関係をもとに、統
合処理を行い、最後に、文字列中の文字の並びを見て、
サイズ, ピッチの変動が少なくなるように統合を行い、
上記除去しておいた濁点, 半濁点の統合を行うようにし
たところに特徴がある。

【００６３】

【発明の効果】以上、詳細に説明したように、本発明の
文字切り出し回路によれば、カナ文字列中から濁点, 半
濁点だけを正確に抽出した後、それらを一時的に除去し
ておくことにより、それらを間違って隣の文字と統合す
ることがなくなる。又、「ル」「ハ」といった分離文字
に対する処理を入れているため、正確な切り出しが可能
である。それ以外の文字を統合する場合も、個々のスト
ロークの位置, サイズ,方向性といった情報だけを見
て、１文字として認識を行っていないので、高速で精度
の高い文字切り出しが可能となる効果がある。

【図面の簡単な説明】

【図１】本発明の原理構成図（その１）

【図２】本発明の原理構成図（その２）

【図３】本発明の原理説明図（その１）

【図４】本発明の原理説明図（その２）

【図５】本発明の原理説明図（その３）

【図６】本発明の原理説明図（その４）

【図７】本発明の原理説明図（その５）

【図８】本発明の原理説明図（その６）

【図９】本発明の原理説明図（その７）

【図１０】本発明の一実施例を流れ図で示した図（その
１）

【図１１】本発明の一実施例を流れ図で示した図（その
２）

【図１２】本発明の一実施例を流れ図で示した図（その
３）

【図１３】従来の手書き文字の切り出し回路を説明する
図（その１）

【図１４】従来の手書き文字の切り出し回路を説明する
図（その２）

【符号の説明】

0 前処理部 01 文字列抽出
部 02 字種データ記憶部 03 文字列内の
字数計測部 1,1a,1b ラベリング 2,2a,2b 外接矩形仮統合手段 3,3a,3b 平均文字サイズ算出手段 4 小矩形抽出手段 5 濁点候補
抽出手段 6 続け字濁点・半濁点抽出手段 8 半濁点抽
出手段 9 「ウ」の抽出手段 10 「シ」
「ツ」の抽出手段 11 半濁点らしさ評価手段 12 濁点, 半濁
点一時的除去手段 13 近傍統合手段 14 「ル」
「ハ」の抽出手段 15 位置・方向性による小ストローク統合手段 16 文字並び・サイズ妥当性による小ストローク統合
手段 17 濁点, 半濁点の統合手段 18 認識処理手段〜濁点の配置分類番号 100 〜111,200 〜203,300 〜303 処理ステップ

───────────────────────────────────────────────────── フロントページの続き (56)参考文献特開平５−166004（ＪＰ，Ａ) 特開平６−52359（ＪＰ，Ａ) 特開昭63−16392（ＪＰ，Ａ) 特開昭61−229177（ＪＰ，Ａ) 特開昭62−229487（ＪＰ，Ａ) 特開昭61−55791（ＪＰ，Ａ) 特許2933801（ＪＰ，Ｂ２) 特許3285837（ＪＰ，Ｂ２) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G06K 9/00 - 9/82 G06F 3/03 G06F 17/22

Claims

(57)【特許請求の範囲】

【請求項１】カタカナ手書き文字列に対してラベリング
処理を施し、個々のストロークの外接矩形を抽出し、該
外接矩形に基づいて該文字列の文字列軸を算出し、該文
字列軸の上方に位置しかつ所定サイズ以下である外接矩
形を小矩形として抽出する小矩形抽出手段と、前記小矩
形抽出手段によって抽出された小矩形同志を統合したサ
イズが所定サイズ以下となる小矩形を濁点候補として抽
出する濁点候補抽出手段とを有するカタカナ手書き文字
切り出し回路であって、更に、前記濁点候補抽出手段が濁点候補としない小矩形に対し
て、そのサイズと、その対応ストロークの縦方向と横方
向の線密度の算出結果から、該小矩形を続け字濁点候補
または半濁点候補として抽出する、続け字濁点・半濁点
候補抽出手段を備えたことを特徴とするカタカナ手書き
文字切り出し回路。
【請求項２】カタカナ手書き文字列に対してラベリング
処理を施し、個々のストロークの外接矩形を抽出し、該
外接矩形に基づいて該文字列の文字列軸を算出し、該文
字列軸の上方に位置しかつ第１の所定サイズ以下である
外接矩形を小矩形として抽出する小矩形抽出手段を有す
るカタカナ手書き文字切り出し回路であって、更に、前記小矩形抽出手段が小矩形としない外接矩形のうち、
前記文字列軸の上方に位置しかつ第２の所定サイズ以下
である外接矩形を半濁点候補として抽出する半濁点抽出
手段を備えたことを特徴とするカタカナ手書き文字切り
出し回路。
【請求項３】請求項２記載のカタカナ手書き文字切り出
し回路であって、さらに、前記半濁点候補に対応するストロークの縦線密度と横線
密度とから半濁点らしさを評価する半濁点らしさ評価手
段を備えたことを特徴とするカタカナ手書き文字切り出
し回路。
【請求項４】請求項１記載のカタカナ手書き文字切り出
し回路であって、さらに、前記濁点候補抽出手段が抽出する濁点候補に対して、そ
の右に位置するストロークの線密度を算出して、該濁点
候補とその右位置ストロークとを統合して文字「ウ」領
域として切り出すか否かを判別する「ウ」の抽出手段を
備えたことを特徴とするカタカナ手書き文字切り出し回
路。
【請求項５】請求項１記載のカタカナ手書き文字切り出
し回路であって、さらに、前記濁点候補抽出手段が抽出する濁点候補および前記続
け字濁点・半濁点候補抽出手段が抽出する続け字濁点候
補について、その右に位置するストロークの線密度，及
び、角度を算出して、前記濁点候補または続け字濁点候
補とその右位置ストロークとを統合して文字「シ」領域
または文字「ツ」領域として切り出すか否かを判別する
「シ」「ツ」の抽出手段を備えたことを特徴とするカタ
カナ手書き文字切り出し回路。
【請求項６】請求項１記載のカタカナ手書き文字切り出
し回路であって、さらに、前記濁点候補抽出手段が抽出する濁点候補または前記続
け字濁点・半濁点候補抽出手段が抽出する続け字濁点候
補または半濁点候補のいずれにも該当しない前記外接矩
形のみに対して、隣接する外接矩形同志を統合した場合
のサイズが所定サイズ以下である場合に、当該の隣接す
る外接矩形を統合して文字領域として切り出す近傍統合
手段を備えたことを特徴とするカタカナ手書き文字切り
出し回路。
【請求項７】請求項１記載のカタカナ手書き文字切り出
し回路であって、さらに、前記外接矩形の位置、サイズ、および対応ストロークの
線密度および角度を基に、右上がりのストロークを抽出
し、その右に位置するストロークについて、複数方向の
線密度を基に、当該左右の２つのストロークを統合して
文字「ル」領域または文字「ハ」領域として切り出すか
否かを判別する「ル」「ハ」の抽出手段を備えたことを
特徴とするカタカナ手書き文字切り出し回路。
【請求項８】請求項７記載のカタカナ手書き文字切り出
し回路であって、前記「ル」「ハ」の抽出手段は、前記
外接矩形の位置、サイズ、および対応ストロークの線密
度および角度を基に、右上がりのストロークを第１のス
トロークとして抽出し、その右に位置する第２のストロ
ークについて、複数方向の線密度を基に、当該第１のス
トロークと第２のストロークとを統合して文字「ル」領
域として切り出すことと判別した場合に、さらに、前記第１のストロークに対応する第１の外接矩形と、前
記第２のストロークに対応する第２の外接矩形との間隔
値と、前記第１の外接矩形と第２の外接矩形とを統合し
た第３の外接矩形のサイズ値とに基づいて、当該左右の
２つのストロークを統合して文字「ル」領域として切り
出すか否かを判別する評価手段を備えたことを特徴とす
るカタカナ手書き文字切り出し回路。
【請求項９】請求項１記載のカタカナ手書き文字切り出
し回路であって、さらに、前記濁点候補抽出手段が濁点候補としない小矩形で、か
つ、前記続け字濁点・半濁点候補抽出手段が続け字濁点
候補または半濁点候補のいずれにも抽出しない小矩形で
あり、かつその位置が前記文字列軸の上方に位置する小
矩形に対応するストロークを分離ストロークとして抽出
し、その分離ストロークの位置、方向性、および該小矩
形の縦横比とに基づいて、該分離ストロークをその左,
もしくは、右に位置するストロークに統合して切り出す
か否かを判別する、位置・方向性による小ストローク統
合手段を備えたことを特徴とするカタカナ手書き文字切
り出し回路。
【請求項１０】請求項１記載のカタカナ手書き文字切り
出し回路であって、さらに、前記文字列軸の下方に位置しかつ所定サイズ以下である
外接矩形に対応するストロークを下方小分離ストローク
として抽出し、該下方小分離ストロークが隣接する場合
に、該下方小分離ストロークの位置と、該下方小分離ス
トロークの並びの直線性と、該下方小分離ストロークの
サイズの妥当性に基づいて、該下方小分離ストロークを
その左，もしくは、右に位置するストロークに統合して
切り出すか否かを判別する、文字並び・サイズ妥当性に
よる小ストローク統合手段を備えたことを特徴とするカ
タカナ手書き文字切り出し回路。