JP2836579B2 - 文字切り出し候補生成装置 - Google Patents

文字切り出し候補生成装置

Info

Publication number
JP2836579B2
JP2836579B2 JP8122333A JP12233396A JP2836579B2 JP 2836579 B2 JP2836579 B2 JP 2836579B2 JP 8122333 A JP8122333 A JP 8122333A JP 12233396 A JP12233396 A JP 12233396A JP 2836579 B2 JP2836579 B2 JP 2836579B2
Authority
JP
Japan
Prior art keywords
line segment
character
stroke
character string
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP8122333A
Other languages
English (en)
Other versions
JPH09288715A (ja
Inventor
永記 石寺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP8122333A priority Critical patent/JP2836579B2/ja
Publication of JPH09288715A publication Critical patent/JPH09288715A/ja
Application granted granted Critical
Publication of JP2836579B2 publication Critical patent/JP2836579B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は光学的に走査された
手書き文字列の画像から文字の切り出し候補を求める文
字切り出し候補生成装置に関し、特に手書き文字をスト
ロークに分解してからそのストロークを組み合わせるこ
とにより文字の切り出し候補を求める装置に関する。
【0002】
【従来の技術】郵便物や帳票上に手書きされた文字列を
光学的文字読み取り装置(OCR)で読み取って文字認
識する場合、認識処理に先立って前処理が実施され、こ
の前処理において、1文字を切り出す際の候補となる幾
つかの文字切り出し候補が求められる。
【0003】従来、このような文字切り出し候補の生成
では、文字列画像が与えられたときに、黒画素の連結成
分や、文字列の垂直方向に黒画素を投影して求めた投影
関数を用いて文字パターンの最小単位を作り、これらの
最小単位を幾つか組み合わせることにより文字切り出し
候補を作成していた。しかし、これらの技術では、文字
パターン同士が接触していた場合に正解を含む文字切り
出し候補を生成することが困難であった。
【0004】このような問題を解決するために、西田ら
は「A Model−BasedSplit−and−
Merge Method for Characte
rString Recognition」(Inte
rnationalJournal of Patte
rn Recognition andArtific
al Intelligence,vol.8,No.5,
pp.1205-1222,1994)において、文字パターンを細線化し
て得られた線を、端点やコーナや分岐点等で分割し、分
割された線を1つのセグメントと考え、これらのセグメ
ントを組み合わせることにより文字切り出し候補を作成
する方式を提案している。図14はこの提案にかかる文
字切り出し候補生成装置の概略ブロック図であり、光学
的に走査された文字列画像を文字列画像記憶部21に格
納後、その文字列画像中の文字パターンを細線化処理部
22で細線化し、次いで、セグメント作成部23におい
て、細線化により得られた線を端点やコーナ等で分割し
てセグメントを作成し、次いで、文字切り出し候補作成
部24において、各セグメントを組み合わせることによ
り文字切り出し候補を作成する。しかし、この方式で
は、細線化処理を行うため、ノイズの影響や線幅の変動
による悪影響を受けやすい。また、文字のストロークが
完全に交差して接触を起こしている箇所があると、正解
を含む文字切り出し候補を求めることが困難になる。
【0005】他方、文字切り出し候補生成のためのスト
ローク抽出ではないが、切り出された文字を文字認識す
る際の特徴として手書き文字からストロークを抽出する
技術が、特開昭57−199075号公報に提案されて
いる。この技術は、文字切り出し後のパターン領域の各
黒画素にその連続方向に対応した方向コードを付ける第
1ステップと、この処理後のパターン領域を方向コード
毎に別々の方向に走査して各方向コード毎の連結性を調
べ、連結した同一方向コードの画素群をストロークとし
て抽出する第2ステップとから構成される。また、第2
ステップでは、抽出途中にあるストローク(注目ストロ
ーク)の他ストロークとの交差を監視し、交差を検出し
た場合、その交差部分では、その直前の走査ラインにお
ける注目ストロークの幅で注目ストロークを延長する
か、その交差部分の直前で注目ラインを終端するか、何
れか予め定められた一方の手順によって注目ストローク
を抽出する。
【0006】
【発明が解決しようとする課題】上記公報記載のストロ
ーク抽出技術によれば、細線化処理を行わない為、それ
に伴う種々の悪影響がなく、また交差したストロークも
一義的に抽出することができる。そこで、この従来のス
トローク抽出技術と前述の西田らの方式とを組み合わせ
ることが考えられるが、そうすると以下のような問題点
が生じる。
【0007】上記公報記載のストローク抽出技術では、
或る方向に連結する画素群を1つのストロークとして抽
出する。このため、或る程度滑らかにつながる曲線部分
は幾つかのストロークとして抽出されることになる。例
えば数字の0のようなパターンは多くのストロークに分
解されることになる。上記公報記載のストローク抽出技
術は文字認識のための特徴としてストロークを抽出する
ため、抽出されるストロークの数が増えてもそれほど問
題にはならないが、文字切り出し候補の生成に適用する
と、抽出されるストローク数が増えれば増えるほどスト
ロークの組み合わせ数、つまり文字切り出し候補の数が
異常に増大し、処理が破綻してしまうことになる。
【0008】そこで本発明の目的は、細線化処理による
悪影響が無く、また交差したストロークも抽出可能であ
り、更に或る程度滑らかにつながる曲線部分を1つのス
トロークとして抽出することによって、生成される文字
切り出し候補の数の増大を抑えた文字切り出し候補生成
装置を提供することにある。
【0009】また上記公報記載のストローク抽出技術で
は、或る方向に連結する画素群を抽出する為に、各黒画
素にその連続方向に対応した方向コードを付け、次いで
方向コード毎に別々の方向に走査して各方向コード毎の
連結性を調べる処理を行っているが、その為には黒画素
数のカウントや方向コード付けで用いる多数のパターン
群との照合等の複雑な処理が必要である。また、交差し
たストロークの抽出を行うためにストロークの交差の監
視処理が必要である。この為、処理が複雑化し高速化に
も限界がある。
【0010】そこで本発明の別の目的は、特定の方向成
分を連続して持つ部分の抽出処理においてモルフォロジ
ー演算を適用することにより、処理の単純化と高速化を
図った文字切り出し候補生成装置を提供することにあ
る。
【0011】
【課題を解決するための手段】本発明は、手書き文字列
の画像を入力して文字の切り出し候補を求める文字切り
出し候補生成装置において、光学的に走査された文字列
画像を格納する文字列画像記憶部と、格納された文字列
画像から特定の方向成分を持つ部分である線分素を抽出
する線分素抽出部と、抽出された線分素をマージして或
る程度滑らかにつながる曲線部分であるストロークを作
成するストローク作成部と、作成されたストロークを組
み合わせて文字切り出し候補を作成する文字切り出し候
補作成部とを備えることを特徴とする。
【0012】また、前記線分素抽出部は、それぞれ異な
る固有角度方向を持った複数の線分パターンを用いて文
字列画像にモルフォロジー演算を行うことによって各固
有角度方向ごとの線分素を抽出する構成を有することを
特徴とする。
【0013】さらに、前記線分素抽出部は、それぞれ異
なる固有角度方向を持った複数の線分パターンを使用し
たモルフォロジー演算によって文字列画像の距離変換画
像を作成し、該距離変換画像を逆変換して各固有角度方
向ごとの線分素を抽出する構成を有することを特徴とす
る。
【0014】また更に、前記ストローク作成部は、互い
に接するか又は交差している線分素どうしの角度,長
さ,位置関係が、予め設定されたマージ可能判定基準を
満たすか否かを調べることによって、線分素どうしのマ
ージ可否を判定する構成を有し、更に、前記マージ可能
判定基準は学習によって作成された基準であることを特
徴とする。
【0015】本発明の文字切り出し候補生成装置にあっ
ては、文字列画像記憶部が光学的に走査された文字列画
像を格納し、線分素抽出部がこの格納された文字列画像
から特定の方向成分を持つ部分である線分素をモルフォ
ロジー演算を使用して抽出し、ストローク作成部がこの
抽出された線分素をマージして或る程度滑らかにつなが
る曲線部分であるストロークを作成し、そして文字切り
出し候補作成部がこの作成されたストロークを組み合わ
せて文字切り出し候補を作成する。
【0016】モルフォロジー演算とは、例えば下記のよ
うな基本演算またはその組み合わせである。 1.dilation:X+B 2.erosion :X−B
【0017】ここで、dilationはBの任意の平
行移動BzがXと交わるようなzの軌跡であり、「+」
は2つの集合XとBのMinkowski和である。e
rosionはBの任意の平行移動BzがXに含まれる
ようなzの軌跡であり、「−」は2つの集合XとBのM
inkowski差である。これらの処理例を図2に示
す。図2からわかるように、dilationはXを膨
張させ、erosionはXを収縮させる作用を持つ。
【0018】なお、dilationとerosion
とを組み合わせた、 3.opening :(X−B)+B 4.closing :(X+B)−B もモルフォロジー演算の一種である。ここで、open
ingはerosionを1回実行した後、dilat
ionを1回実行する演算に相当し、境界を滑らかに
し、狭い地峡形状,小島および鋭く尖った岬形状を除去
する作用を持つ。一方、closingはdilati
onを1回実行した後、erosionを1回実行する
演算に相当し、境界を滑らかにし、狭い間隙,細長い割
れ目および小さな穴を溶融する作用を持つ。
【0019】モルフォロジー演算において、上記の構成
要素Bとして例えば図3のQ1のような方向を持ったパ
ターンを与えて、例えば図4(1)に示すようなXのパ
ターンに対してerosionを何回か行うと、構成要
素Bの持つ方向以外の成分を除去することができる。図
4(2)はerosionを1回行った結果であり、図
4(3)はerosionを2回行った結果である。こ
のようにモルフォロジー演算によって方向成分を抽出す
ることができる。
【0020】同様に、モルフォロジー演算による距離変
換によっても、特定の方向成分を抽出できる。例えば構
成要素Bとして図3(1)のQ1のような方向を持った
パターンを与えて図4(1)に示すようなXのパターン
に対して距離変換を行うと、図4(4)のような距離画
像が得られ、この距離変換された画像から特定の方向成
分の強さを得ることができる。従って、距離変換された
画像の或る距離値以上の部分について逆距離変換する
と、構成要素Bが多く含まれている部分を再現できる。
例えば、図4(4)の距離値が3以上の部分にdila
tionを2回(距離値−1回)施すことで、図4
(5)に示すように構成要素Bが多く含まれている部分
を再現することができる。なお、モルフォロジー演算に
よる距離変換については、Xiaoli WangとG
illes Bertrandによる「Some Se
quential Algorithms for a
Generalized Distance Tra
nsformation Based on Mink
owski Operation」(IEEE Tra
ns.Patt.Anal.and Machine
Intell,vol.14,No.11,pp.11
14−1121,1992)に記載されている。
【0021】このようにモルフォロジー演算によって方
向成分抽出を行う場合にあっては、パターンを細線化す
ることによるヒゲのようなノイズや交差点付近での線方
向の乱れ、ノイズの悪影響等を抑制することが可能であ
る。
【0022】
【発明の実施の形態】次に本発明の実施の形態の例につ
いて図面を参照して詳細に説明する。
【0023】図1を参照すると、本発明の一実施例の文
字切り出し候補生成装置は、手書き文字列の画像を入力
し、文字の切り出し候補を出力する装置であって、文字
列画像記憶部11と線分素抽出部12とストローク作成
部13と文字切り出し候補作成部14とから構成されて
いる。
【0024】本実施例の文字切り出し候補生成装置にお
いては、光学的に走査された文字列画像が文字列画像記
憶部11に格納されており、文字切り出し候補の生成に
際しては、先ず線分素抽出部12が文字列画像記憶部1
1に格納された文字列画像から特定の方向成分を持つ部
分である線分素をモルフォロジー演算を使用して抽出す
る。次に、ストローク作成部13が上記抽出された線分
素をマージして或る程度滑らかにつながる曲線部分であ
るストロークを作成する。そして、最後に文字切り出し
候補作成部14が上記作成されたストロークを組み合わ
せて文字切り出し候補を作成し、出力する。以下、本実
施例の各部の機能について、その動作と共に説明する。
【0025】文字列画像記憶部11は、イメージスキャ
ナ等の通常の画像入力手段によって光学的に走査された
文字列画像を入力して格納する記憶手段であり、文字列
画像は例えば2値化された画像である。
【0026】線分素抽出部12は、文字列画像記憶部1
1に格納された文字列画像から特定の方向成分を持つ部
分である線分素を抽出する手段である。本実施例の線分
素抽出部12は線分素の抽出にモルフォロジー演算を利
用する。以下、線分素抽出部12において、モルフォロ
ジー演算を使用して文字列画像から線分素を抽出する方
法について説明する。
【0027】先ず、それぞれ異なる固有角度方向を持つ
線分パターンを準備する。本実施例では、図3に示すよ
うな8方向の線分パターンQ1〜Q8を準備し、これら
のパターンをそれぞれの固有角度方向を持つ構成要素と
する。ここで、水平方向に対して、Q1は0.0度、Q
2は22.5度、Q3は45.0度、Q4は67.5
度、Q5は90.0度、Q6は112.5度、Q7は1
35.0度、Q8は157.5度の、固有角度方向を持
っている。
【0028】線分素抽出部12は、文字列画像記憶部1
1に格納された文字列画像を入力し、上記の8つの線分
パターンQ1〜Q8を使用して文字列画像から線分素を
抽出する。この抽出には幾つかの方法が考えられる。そ
の代表的な幾つかについて、その処理の流れを図5,図
6,図7に示す。
【0029】(1)線分素抽出例1(図5参照) 先ず内部変数iを1に初期設定し(ST1)、文字列画
像記憶部11から文字列画像を入力し(ST2)、この
入力した文字列画像に対して線分パターンQ1を使用し
てerosionをN回繰り返す(ST3)。ここで、
Nは予め定められた値である。なお、文字列画像中の線
幅を計測し、その線幅に応じてNを定めるようにしても
良い。次に、erosion処理後の文字列画像に対し
て線分パターンQ1を使用してdilationを、e
rosionを行った回数と同じ回数Nだけ繰り返す
(ST4)。そして、このdilation処理後の文
字列画像中に存在する各々分離した部分のそれぞれを、
線分パターンQ1の固有角度方向(0.0度)を持つ線
分素として抽出する(ST5)。次いで、変数iを+1
し(ST6)、ステップST2に戻って線分パターンQ
2を使用して同様の動作を行い、線分パターンQ2の固
有角度方向(22.5度)を持つ線分素を抽出する。以
上と同様な動作を線分パターンQ3,Q4,Q5,Q
6,Q7,Q8を使用して繰り返し、固有角度方向4
5.0度,67.5度,90.0度,112.5度,1
35.0度,157.5度をそれぞれ持つ線分素を抽出
し、最後の線分パターンQ8を用いた処理を完了した時
点で処理を終了する(ST7)。
【0030】(2)線分素抽出例2(図6参照) 先ず変数iを1に初期設定し(ST11)、文字列画像
記憶部11から文字列画像を入力し(ST12)、この
入力した文字列画像を線分パターンQ1を使用して距離
変換し、距離画像を求める(ST13)。次に、この距
離画像のローカルなピーク値または予め定められた閾値
以上の部分だけを用いて逆距離変換を施す(ST1
4)。なお、文字列画像中の線幅を計測し、その値に応
じて前記閾値を定めるようにしても良い。次に、上記の
逆距離変換処理後の文字列画像中に存在する各々分離し
た部分のそれぞれを、線分パターンQ1の固有角度方向
(0.0度)を持つ線分素として抽出する(ST1
5)。次いで、変数iを+1し(ST16)、ステップ
ST12に戻って線分パターンQ2を使用して同様の動
作を行い、線分パターンQ2の固有角度方向(22.5
度)を持つ線分素を抽出する。以上と同様な動作を線分
パターンQ3,Q4,Q5,Q6,Q7,Q8を使用し
て繰り返し、固有角度方向45.0度,67.5度,9
0.0度,112.5度,135.0度,157.5度
をそれぞれ持つ線分素を抽出し、最後の線分パターンQ
8を用いた処理を完了した時点で処理を終了する(ST
17)。
【0031】(3)線分素抽出処理例3(図7参照) 先ず変数iを1に初期設定し(ST21)、文字列画像
記憶部11から文字列画像を入力し(ST22)、この
入力した文字列画像を線分パターンQ1を使用して距離
変換し、距離画像を求める(ST23)。次に、変数i
を+1し(ST24)、ステップST22に戻って線分
パターンQ2を使用して同様の動作を行い、線分パター
ンQ2による距離画像を求める。以上と同様な動作を線
分パターンQ3,Q4,Q5,Q6,Q7,Q8を使用
して繰り返し、各線分パターン毎の距離画像を生成し、
最後の線分パターンQ8を用いた処理を完了した時点で
ステップST26へ進む(ST25)。
【0032】次にステップST26では、上述のように
して求めた全ての距離画像を、x座標(画像の横軸),
y座標(画像の縦軸)、θ座標(固有角度方向)の3次
元データとみなして平滑化を行い、平滑化された固有角
度方向距離画像B1〜B8を作成する。この平滑化は、
例えば3次元のガウシアンを畳み込んだり、3×3×3
のフィルタを畳み込むことにより実現可能である。
【0033】次いで、ステップST27〜ST31を実
行して各固有角度方向ごとの線分素を抽出する。つま
り、先ず変数iを1に初期設定し(ST27)、線分パ
ターンQ1にかかる固有角度方向距離画像B1のローカ
ルなピーク値または或る閾値以上の部分だけを用いて逆
距離変換を施し(ST28)、この逆距離変換処理後の
文字列画像中に存在する各々分離した部分のそれぞれ
を、線分パターンQ1の固有角度方向(0.0度)を持
つ線分素として抽出する(ST29)。そして、変数i
を+1し(ST30)、ステップST28に戻って線分
パターンQ2にかかる固有角度方向距離画像B2につい
て同様の処理を行い、線分パターンQ2の固有角度方向
(22.5度)を持つ線分素を抽出する。以上と同様な
動作を線分パターンQ3,Q4,Q5,Q6,Q7,Q
8にかかる固有角度方向距離画像B3,B4,B5,B
6,B7,B8について繰り返し、固有角度方向45.
0度,67.5度,90.0度,112.5度,13
5.0度,157.5度をそれぞれ持つ線分素を抽出
し、最後の線分パターンQ8にかかる固有角度方向距離
画像の処理を完了した時点で処理を終了する(ST3
1)。
【0034】図8(1)〜(4)に線分素抽出の例を示
す。同図(1)は文字列画像の例を示し、同図(2),
(3),(4)は抽出された各々の線分素の例を示す。
ここで、同図(2)は0.0度の固有角度方向を持つ線
分素P2を、同図(3)は22.5度の固有角度方向を
持つ線分素P1を、同図(4)は67.5度の固有角度
方向を持つ線分素P1を、それぞれ示す。なお、前述し
た公報の従来技術では、この各線分素P1〜P3の1つ
1つがストロークとして抽出される。
【0035】次に図1におけるストローク作成部13に
ついて説明する。前述したようにストローク作成部13
は、線分素抽出部12によって抽出された線分素を組み
合わせて(マージして)、或る程度滑らかにつながる曲
線部分であるストロークを作成する。
【0036】図9はストローク作成部13の処理の一例
を示すフローチャートである。先ず、ストローク作成部
13は、線分素抽出部12で抽出された線分素のうちの
1つの線分素に着目する(ST41)。次に、この着目
線分素と接しているか又は交わっている全ての線分素を
求め、これらを着目線分素に対するマージ候補とする
(ST42)。線分素どうしが接しているか、交わって
いるかの判定は、線分素の外接矩形を考え、外接矩形ど
うしが接しているか、交わっているかを調べることで行
う。次に、着目線分素とそのマージ候補となる各線分素
とのマージ可否を、線分素どうしの角度,長さ,位置関
係を考慮して判定する(ST43)。この判定方法につ
いては後述する。1つの線分素に着目した上述の処理を
終えると、次の1つの線分素に着目し(ST44)、先
と同様に、その線分素と接しているか又は交わっている
線分素どうしのマージ可否を判定する。なお、既にマー
ジ可否の判定が下されている線分素どうしのマージ可否
の判定は省略される。以上の処理を最後の線分素まで繰
り返し、全ての線分素に着目し終えると、ステップST
46へ進む(ST45)。ステップST46では、ステ
ップST43の処理においてマージ可能と判定された線
分素どうしを全てマージしてストロークを作成する。
【0037】線分素どうしのマージ可否の判定処理につ
いて、図8および図10を参照して説明する。
【0038】前述したように線分素抽出部12の処理に
よって、図8(1)の文字列画像から同図(2)〜
(4)に示す3つの線分素p2,p1,p3が抽出され
たとする。今、線分素p1に着目し、この線分素p1の
マージ候補を求めると、各線分素p1〜p3の外接矩形
は図8(5)のr1〜r3に示すものとなり、線分素p
2,p3の外接矩形r2,r3が線分素p1の外接矩形
r1と交わっているので、線分素p2,p3の双方が線
分素p1のマージ候補となる。そこで、線分素p1と線
分素p2とのマージ可否と、線分素p1と線分素p3と
のマージ可否とを判定する。これらの判定方法は同じな
ので、以下では、線分素p1と線分素p2とのマージ可
否の判定を例にして判定方法を説明する。
【0039】先ず、線分素p1の外接矩形をr1,線分
素p1の持つ固有角度方向をθ1,外接矩形r1の対角
線長をL1とし、線分素p2の外接矩形をr2,線分素
p2の持つ固有角度方向をθ2,外接矩形r2の対角線
長をL2とする。そして、図10に示すように、外接矩
形r1の中心点と外接矩形r2の中心点との間の距離を
d12、外接矩形r1の中心から外接矩形r2の中心点
へのベクトルと線分素p1の固有角度方向を表す軸との
なす角度をω12とする。また、線分素p1の持つ固有
角度方向θ1と線分素p2の持つ固有角度方向θ2との
差の絶対値をφ12とする。このとき、線分素p1と線
分素p2とのマージ可否は、[φ12,L1,L2,d
12,ω12]を5次元のデータと考え、このデータが
予め設定された5次元空間内のマージ可能領域に含まれ
ている場合はマージ可能と判定し、含まれていない場合
はマージ不可能と判定する。マージ可能領域とは5次元
空間内に予め定められた或る領域である。
【0040】ここで、マージ可否の判定に用いる各パラ
メータについて、その意義を説明する。線分素p1の持
つ固有角度方向θ1と線分素p2の持つ固有角度方向θ
2との差の絶対値φ12と、外接矩形r1の中心から外
接矩形r2の中心点へのベクトルと線分素p1の固有角
度方向を表す軸とのなす角度ω12とは、いずれも線分
素どうしの角度に関係するパラメータである。或る程度
滑らかにつながる曲線部分をストロークとするために
は、このφ12とω12とは共に或る程度小さな値であ
ることが必要である。なお、φ12は固有角度方向の差
の絶対値であるため、φ12の値が同じであっても2つ
の線分素p1,p2が鈍角で交わる場合と鋭角で交わる
場合とがあるため、角度ω12をも考慮している。
【0041】外接矩形r1の対角線長L1と外接矩形r
2の対角線長L2とは、線分素の長さに関係するパラメ
ータである。線分素の長さを考慮するのは、少なくとも
一方の線分素が極端に短い場合、φ12及びω12が比
較的大きくても、或る程度滑らかにつながっているよう
に見えるからである。従って、L1,L2の何れか一方
が極端に短い場合には、φ12及びω12が比較的大き
くてもマージ可能となるように5次元空間内のマージ可
能領域が設定されている。
【0042】外接矩形r1の中心点と外接矩形r2の中
心点との間の距離d12は、線分素どうしの位置関係に
関するパラメータである。このような距離を考慮するの
は、距離d12が大きいと、φ12及びω12が比較的
大きくても、或る程度滑らかにつながっているように見
えるのに対し、距離d12が小さいとその逆に見えるか
らである。従ってd12が比較的大きい場合には、φ1
2及びω12が比較的大きくてもマージ可能となるよう
に5次元空間内のマージ可能領域が設定されている。
【0043】以上のようなパラメータで規定される5次
元空間内のマージ可能領域は、統計的な学習を行うこと
によって決定することが可能である。このとき、マージ
すべき線分素とマージするべきでない線分素を予め人間
が与え、例えば回帰分析,主成分分析,判別分析,ニュ
ーラルネット等を用いてマージ可否の基準を決定するこ
とができる。
【0044】図11(1),(2)にストローク作成の
例を示す。同図(1)は文字列画像の例を示し、同図
(2)は同図(1)の文字列画像から抽出された線分素
をマージして作成したストロークの例を示す。ここで、
ストロークs1は図8の線分素p1,p2をマージして
作成されたストロークに相当し、ストロークs2は図8
の線分素p3のみから構成されるストロークに相当す
る。他のストロークs4,s5は図8には示していない
が、単独または幾つかの線分素をマージして作成された
ストロークである。
【0045】次に、文字切り出し候補作成部14につい
て説明する。前述したように文字切り出し候補生成部1
4は、ストローク作成部13によって作成されたストロ
ークを組み合わせて文字切り出し候補を作成し出力す
る。
【0046】図12は文字切り出し候補作成部14の処
理の一例を示すフローチャートである。先ず、文字切り
出し候補作成部14は、ストローク作成部13で作成さ
れた各ストロークをその外接矩形の中心座標が上になる
順番でソートする(ST51)。次に、内部変数iを1
に初期設定し(ST52)、まずソート順位1番のスト
ロークを基点として、予め定められたM個の文字切り出
し候補を作成し、出力する(ST53〜ST56)。つ
まり、内部変数jを0に初期設定し(ST53)、最初
はソート順位1番のストロークのみの部分を文字切り出
し候補とし(ST54)、次いでjを+1して、ソート
順位1番のストロークとソート順位2番のストロークと
の組み合わせを文字切り出し候補とし(ST54)、以
下同様に、ソート順位1番,2番,3番のストロークの
組み合わせの文字切り出し候補,……,1番,2番,
…,M−1番のストロークの組み合わせの文字切り出し
候補を作成する。そして、ソート順位1番のストローク
を基点としてM個の文字切り出し候補を作成し出力する
と(ST56)、変数iを+1し(ST57)、ステッ
プST53に戻って上述した処理を繰り返し、ソート順
位2番のストロークのみの部分の文字切り出し候補,ソ
ート順位2番,3番のストロークの組み合わせの文字切
り出し候補,……,ソート順位2番,3番,…,2+M
−1番のストロークの組み合わせの文字切り出し候補か
ら構成されるM個の文字切り出し候補を作成し、出力す
る。以上の処理をソート順位の最後のストロークまで繰
り返す(ST58)。なお、ステップST54では既に
生成された文字切り出し候補と同じ候補の生成は省略さ
れる。また、文字切り出し候補はその候補に含まれる全
ストロークを包含する外接矩形の形状を持つ。
【0047】図13に、図11のようなストロークs1
〜s5から作成された文字切り出し候補の例を示す。図
13の外接矩形W1〜W3は図11のストロークs1を
基点として作成された文字切り出し候補を、外接矩形W
4〜W6はストロークs2を基点として作成された文字
切り出し候補を、外接矩形W7〜W9はストロークs3
を基点として作成された文字切り出し候補を、外接矩形
W10,W11はストロークs4を基点として作成され
た文字切り出し候補を、外接矩形W12はストロークs
5を基点として作成された文字切り出し候補を、それぞ
れ示す。なお、図13の例では、組み合わせるストロー
クの最大数を3(=M)としているが、組み合わせるス
トロークの最大数は3に限定されず、それ以上の数でも
よい。
【0048】
【発明の効果】以上説明したように本発明によれば、は
じめに文字列画像を線分素に分解し、次いで線分素をマ
ージして或る程度滑らかにつながる曲線部分であるスト
ロークを作成し、そしてこのストロークを組み合わせて
文字切り出し候補を作成するものであり、細線化処理を
行わないのでそれに伴う悪影響が無く、また交差したス
トロークも抽出できる。そして、隣接する文字間が接触
ないし重なっている場合、文字の接触部分で互いのスト
ロークが滑らかにつながることは稀なため、ストローク
を組み合わせた文字切り出し候補中に正解を含む確率を
高めることができる。また、或る程度滑らかにつながる
曲線部分を1つのストロークとして抽出することによっ
て、生成される文字切り出し候補の数の増大を抑えるこ
とができる。更に、線分素の抽出をモルフォロジー演算
を使用して行うことにより、処理の単純化と高速化が可
能となる。
【図面の簡単な説明】
【図1】本発明の一実施例のブロック図である。
【図2】モルフォロジーの基本演算の説明図である。
【図3】方向を持った線分パターンの例を示す図であ
る。
【図4】モルフォロジー演算によって画像から方向を持
った部分が抽出される様子を示す図である。
【図5】線分素抽出部の処理の一例を示すフローチャー
トである。
【図6】線分素抽出部の処理の他の例を示すフローチャ
ートである。
【図7】線分素抽出部の処理のまた更に別の例を示すフ
ローチャートである。
【図8】文字列画像とそれから抽出される線分素の例を
示す図である。
【図9】ストローク作成部の処理例を示すフローチャー
トである。
【図10】線分素のマージ可否を判定する際に用いるデ
ータの説明図である。
【図11】文字列画像とそれから作成されたストローク
の例を示す図である。
【図12】文字切り出し候補作成部の処理例を示すフロ
ーチャートである。
【図13】ストロークを組み合わせて作成された文字切
り出し候補の例を示す図である。
【図14】従来技術のブロック図である。
【符号の説明】
11…文字列画像記憶部 12…線分素抽出部 13…ストローク作成部 14…文字切り出し候補作成部

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】 手書き文字列の画像を入力して文字の切
    り出し候補を求める文字切り出し候補生成装置におい
    て、 光学的に走査された文字列画像を格納する文字列画像記
    憶部と、 格納された文字列画像から特定の方向成分を持つ部分で
    ある線分素を抽出する線分素抽出部と、 抽出された線分素をマージして或る程度滑らかにつなが
    る曲線部分であるストロークを作成するストローク作成
    部と、 作成されたストロークを組み合わせて文字切り出し候補
    を作成する文字切り出し候補作成部とを備えることを特
    徴とする文字切り出し候補生成装置。
  2. 【請求項2】 前記線分素抽出部は、それぞれ異なる固
    有角度方向を持った複数の線分パターンを用いて文字列
    画像にモルフォロジー演算を行うことによって各固有角
    度方向ごとの線分素を抽出する構成を有することを特徴
    とする請求項1記載の文字切り出し候補生成装置。
  3. 【請求項3】 前記線分素抽出部は、それぞれ異なる固
    有角度方向を持った複数の線分パターンを使用したモル
    フォロジー演算によって文字列画像の距離変換画像を作
    成し、該距離変換画像を逆変換して各固有角度方向ごと
    の線分素を抽出する構成を有することを特徴とする請求
    項1記載の文字切り出し候補生成装置。
  4. 【請求項4】 前記ストローク作成部は、互いに接する
    か又は交差している線分素どうしの角度,長さ,位置関
    係が、予め設定されたマージ可能判定基準を満たすか否
    かを調べることによって、線分素どうしのマージ可否を
    判定する構成を有することを特徴とする請求項2または
    3記載の文字切り出し候補生成装置。
  5. 【請求項5】 前記マージ可能判定基準が学習によって
    作成された基準であることを特徴とする請求項4記載の
    文字切り出し候補生成装置。
JP8122333A 1996-04-19 1996-04-19 文字切り出し候補生成装置 Expired - Fee Related JP2836579B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8122333A JP2836579B2 (ja) 1996-04-19 1996-04-19 文字切り出し候補生成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8122333A JP2836579B2 (ja) 1996-04-19 1996-04-19 文字切り出し候補生成装置

Publications (2)

Publication Number Publication Date
JPH09288715A JPH09288715A (ja) 1997-11-04
JP2836579B2 true JP2836579B2 (ja) 1998-12-14

Family

ID=14833383

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8122333A Expired - Fee Related JP2836579B2 (ja) 1996-04-19 1996-04-19 文字切り出し候補生成装置

Country Status (1)

Country Link
JP (1) JP2836579B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4737576B2 (ja) * 2001-02-01 2011-08-03 日本電気株式会社 ストローク抽出装置、ストローク抽出方法及びストローク抽出用プログラムを記録した記録媒体
CN109766978B (zh) * 2019-01-17 2020-06-16 北京悦时网络科技发展有限公司 一种词码的生成方法、识别方法、装置、存储介质

Also Published As

Publication number Publication date
JPH09288715A (ja) 1997-11-04

Similar Documents

Publication Publication Date Title
US4654873A (en) System and method for segmentation and recognition of patterns
US6072895A (en) System and method using minutiae pruning for fingerprint image processing
JPH10240943A (ja) 試験署名検証方法
JP3830998B2 (ja) 罫線除去方法及びこれを用いた文字認識装置
US6246793B1 (en) Method and apparatus for transforming an image for classification or pattern recognition
Melhi et al. A novel triangulation procedure for thinning hand-written text
JP2836579B2 (ja) 文字切り出し候補生成装置
Fan et al. Skeletonization of binary images with nonuniform width via block decomposition and contour vector matching
Ablameyko et al. Recognition of engineering drawing entities: review of approaches
JP4543675B2 (ja) 文字・図形の認識方法
Ramel et al. A structural representation adapted to handwritten symbol recognition
KR0186025B1 (ko) 후보 문자 분류 방법
JP3172498B2 (ja) イメージ認識用特徴値抽出方法、およびその装置、イメージ解析プログラムを格納する記憶媒体
JP2004094644A (ja) 画像処理装置、画像処理方法、記憶媒体及びプログラム
US5894525A (en) Method and system for simultaneously recognizing contextually related input fields for a mutually consistent interpretation
JPH01129358A (ja) 表数値演算装置
Tung et al. Performance analysis of an OCR system via an artificial handwritten chinese character generator
JP4737576B2 (ja) ストローク抽出装置、ストローク抽出方法及びストローク抽出用プログラムを記録した記録媒体
Zeki et al. New primitives to reduce the effect of noise for handwritten features extraction
Kim et al. Automatic input of logic diagrams by recognizing loop-symbols and rectilinear connections
JP3379327B2 (ja) 文字認識装置
JP3446794B2 (ja) 文字認識における多角形近似法および文字認識装置
JP3329528B2 (ja) ドキュメント読取り装置
JP2623559B2 (ja) 光学式文字読取装置
JPH0821059B2 (ja) 文字輪郭生成時の不要データ除去方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071009

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081009

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091009

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091009

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101009

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111009

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121009

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131009

Year of fee payment: 15

LAPS Cancellation because of no payment of annual fees