JP2976954B2 - 文字切り出し候補生成装置 - Google Patents

文字切り出し候補生成装置

Info

Publication number
JP2976954B2
JP2976954B2 JP9318638A JP31863897A JP2976954B2 JP 2976954 B2 JP2976954 B2 JP 2976954B2 JP 9318638 A JP9318638 A JP 9318638A JP 31863897 A JP31863897 A JP 31863897A JP 2976954 B2 JP2976954 B2 JP 2976954B2
Authority
JP
Japan
Prior art keywords
stroke
candidate
contact
cutting
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP9318638A
Other languages
English (en)
Other versions
JPH11149521A (ja
Inventor
永記 石寺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP9318638A priority Critical patent/JP2976954B2/ja
Publication of JPH11149521A publication Critical patent/JPH11149521A/ja
Application granted granted Critical
Publication of JP2976954B2 publication Critical patent/JP2976954B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は光学的に走査された
手書き文字列の画像から文字の切り出し候補を求める文
字切り出し候補作成装置に関し、特に手書き漢字をスト
ロークに分解して接触したストロークをさらに複数のス
トロークに切断してからそのストロークを組み合わせる
ことにより文字の切り出し候補を求める装置に関する。
【0002】
【従来の技術】郵便物や帳票上に手書きされた文字列を
光学的文字読み取り装置(OCR)で読み取って文字認
識する場合、認識処理に先立って前処理が実施され、こ
の前処理において、1文字を切り出す際の候補となる幾
つかの文字切り出し候補が求められる。
【0003】従来、このような文字切り出し候補の生成
では、文字列画橡が与えられたときに、黒画素の連結成
分や、文字列の垂直方向に黒画素を投影して求めた投影
関数を用いて文字パターンの最小単位を作り、これらの
最小単位を幾つか組み合わせることにより文字切り出し
候補を生成していた。しかし、これらの技術では、文字
パターン同士が接触していた場合に正解を含む文字切り
出し候補を生成することが困難であった。
【0004】このような問題を解決するために、“西脇
他:「ラン特徴を用いた接触手書き数字の切り出し認
識」(信学ソ大、D−185、1995)”では、スト
ロークの幅の変化が大きな箇所を切り出し候補箇所とし
て強制的に切断する方法が提案きれている。また、“西
田他;「A Model−Based Split−a
nd−Merge Method for Chara
cter StringRecognition」(I
nternational JournalOf Pa
ttern Recognition and Art
ificial Intelligence,Vol.
8,No.5,PP・1205−1222,199
4)”では、文字列画像を細線化して得られた線を、端
点やコーナーや分岐点等で分割し、分割された線を1つ
のセグメントと考え、これらのセグメントを組み合わせ
ることにより文字切り出し候補を作成する方式が提案さ
れている。
【0005】しかし、これらの方法では、対象とする文
字列が漢字で記載されていた場合に、切り出し候補数が
多くなりすぎて処理が破綻してしまうという問題があっ
た。
【0006】一方で、文字列画像をモフォロジー演算を
用いて特定の方向を向いた線分(線分素)に分解し、こ
れらの線分をマージしてストロークを作成し、ストロー
クを文字切り出しの最小単位として文字切り出し候補を
作成する方法が“石寺他:「ストローク抽出に基づく文
字切り出しの一手法」(信学ソ大、D−348、199
6)”において提案されている。
【0007】しかし、この方式によると、図2のよう
『平』の縦ストロークと『田』の中央の縦ストロークの
ようにストローク同士が滑らかに接触している場合に
は、これらを切り離すことができず一つのストロークと
して抽出されてしまうので、接触文字を切り出すことが
困難な場合があるという欠点がある。
【0008】
【発明が解決しようとする課題】本発明の目的は、この
ような問題点を改善し、漢字のような複雑な文字に対し
ても、生成される文字切り出し候補の数の増大を抑えた
文字切り出し候補の作成装置を提供することである。
【0009】
【課題を解決するための手段】本発明の文字切り出し候
補作成装置は、光学的に走査された文字列画像を入力し
て記憶する文字列画像記憶部と、前記文字列画像記憶部
から前記文字列画像を入力して初期ストロークを抽出す
る初期ストローク抽出部と、前記初期ストロークが接触
したストロークかどうかを判定する接触ストローク判別
部と、前記接触ストローク判別部において接触していな
いと判定された前記初期ストロークを一時的に記憶する
非接触ストロークバッファと、前記接触ストローク判別
部において接触していると判定された前記初期ストロー
クを切断して更新されたストロークを作成するストロー
ク切断部と、前記非接触ストロークバッファと前記スト
ローク情報更新部からそれぞれ前記初期ストロークと前
記更新されたストロークを入力して、それらの幾つかの
組み合わせを作成することによって文字切り出し候補を
生成する文字切り出し候補作成部とを備えて構成され
る。
【0010】前記ストローク切断部は、接触していると
判断された前記初期ストロークに対する切断候補となる
箇所を抽出する切断候補抽出部と、前記切断候補から実
際に切断するべき箇所を幾つか切断箇所として選択する
最適候補選択部と、前記接触していると判断された前記
初期ストロークを前記切断箇所で切断して新しいストロ
ークを作成するストローク情報更新部とを有するものを
含む。
【0011】前記接触ストローク判別部は、前記初期ス
トロークの長さと入力された前記文字列画像の大きさと
の関係と、入力された前記文字列画像の投影ヒストグラ
ムと前記初期ストロークの位置の関係を用いて複数の評
価尺度を用いて前記初期ストロークの接触可能性を算出
するものを含む。
【0012】前記初期ストロークの接触可能性を算出す
る際の基準が学習によって作成された基準であってもよ
い。
【0013】前記最適候補選択部は、多数得られた前記
切断候補のなかから、実際に切断すべき可能性の高い順
に予め決められた候補数を選択する際に、前記文字列全
体と前記切断候補点の位置関係、前記切断候補点付近に
おける前記文字列全体の投影ヒストグラムの値を用いて
選択するものを含む。
【0014】前記最適候補選択部は、前記切断候補の切
断すべき可能性を算出する際の基準が学習によって作成
された基準であるものを含む。
【0015】
【発明の実施の形態】次に本発明の実施の形態の例につ
いて図面を参照して説明する。
【0016】図1は本発明の文字切り出し候補装置の一
実施形態のブロック図、図2は図1の文字列画像記憶部
1に記憶された接触した文字の入力画像の例を示す図、
図3は図1の初期ストローク抽出部12の抽出結果を説
明する図であって同図(a)は接触ストロークを含まな
い図、同図(b)は接触ストロークを含む図、図4は図
2の入力画像の文字列方向をX軸方向としたときのX軸
への黒画素の投影ヒストグラムを説明する図、図5は図
1のストローク切断部15の処理結果を説明する図、図
6は図1の最適候補選択部15bの処理の例を説明する
図であって、同図(a)は接触ストロークを示す図、同
図(b)は尤度値テーブルを示す図、図7は図1の最適
候補選択部15bの処理の他の例を説明する図であっ
て、同図(a)は接触ストロークを示す図、同図(b)
は投影ヒストグラムを示す図、図8は図1のストローク
情報更新部15cで作成された新しいストロークを説明
する図である。
【0017】この文字切り出し候補作成装置は図1に示
すように、文字列画像記憶部11と初期ストローク抽出
部12と接触ストローク判別部13と非接触ストローク
バッファ1aとストローク切断部15と文字切り出し候
補作成部16とから構成され、さらにストローク切断部
15は切断候補抽出部15aと最適候補選択部15bと
ストローク情報更新部15cとから構成されている。
【0018】文字列画像記憶部11は光学的に走査され
た文字列画像を入力して記憶する。初期ストローク抽出
部12は文字列画像記憶部11から文字列画像を入力し
て初期ストロークを抽出する。接触ストローク判別部1
3は文字列画像から抽出した初期ストロークが接触した
ストロークかどうかを判別する。非接触ストロークバッ
ファ14は接触ストローク判別部13において接触して
いないと判定されたストロークを一時的に記憶する。ス
トローク切断部15は接触ストローク判別部13におい
て接触していると判定されたストロークを切断して新し
く更新されたストロークを作成する。すなわち、ストロ
ーク切断部15では切断候補抽出部15aが接触ストロ
ークに対する切断候補となる箇所を抽出し、最適候補選
択部15bが切断候補から実際に切断するべき箇所を幾
つか選択し、ストローク情報更新部15cが接触ストロ
ークを選択された切断箇所で切断して新しいストローク
を作成する。文字切り出し候補作成部16は非接触スト
ロークバッファ14とストローク情報更新部15cから
それぞれストロークを入力して、それらの幾つかの組み
合せを作成することによって文字切り出し候補を生成す
る。
【0019】次に、本実施形態の文字切り出し候補生成
装置の動作について説明する。
【0020】初期ストローク抽出部12では、文字列画
像記憶部11から文字列画像を入力して初期ストローク
を抽出する。初期ストロークを抽出するためには、例え
ば“石寺他:「ストローク抽出に基づく文字切り出しの
一手法」(信学ソ大、D−348、1996)”を用い
て容易に実現することが可能である。
【0021】初期ストローク抽出部12に図2の入力画
像のようなパターンが入力されると、図3(a)および
(b)のストローク抽出結果のように10個のストロー
クに分解される。この状態では『平』の縦ストロークと
『田』の中央のストロークがつながって(b)に示すよ
うに、一つのストロークとして抽出されており、5番目
のストロークとして表示されている。
【0022】接触ストローク判別部13では、初期スト
ロークが接触を起こしたストロークかどうかを判定す
る。
【0023】この判断にはいくつかの方法が考えられる
が、例えば、ストロークの長さと入力されたパターンの
大きさとの関係と、入力されたパターンの投影ヒストグ
ラムとストロークの位置の関係を用いることが可能であ
る。ここでは、判別に複数の評価尺度を用いる。一つは
ストロークの長さと入力されたパターンの大きさとの関
係である。もう一つは、入力されたパターンの投影ヒス
トグラムとストロークの位置の関係である。
【0024】ストロークの長さと入力されたパターンの
大きさとの関係を用いた評価尺度は、入力されたパター
ンの外接矩形の幅をW、高さをHとし、i番目のストロ
ークの外接矩形の幅をw(i)、高さをh(i)とし
て、 F1=h(i)/H F2=h(i)/W F3=(w(i)+h(i))/(H+W) このF1、F2、F3がストロークの長さと入力された
パターンの大きさとの関係を用いた評価尺度(特徴)で
あり、接触ストローク判別に用いられる。
【0025】つぎに、パターンの投影ヒストグラムによ
る評価尺度(特徴)について説明する。文字列方向の軸
(この軸をX軸と置く)に対して垂直に入力パターンを
投影したヒストグラムを求め、Hist(X)とする。
図4の例ではHist(X)の値域は入力パターンのX
座標の最小値Xminから入力パターンのX座標の最大
値Xmaxまでである。また、Hist(X)の最大値
をMaxとして f(X)=(Max−Hist(X))/Max とする。このときに、i番目のストロークとX軸上で重
なっている部分、すなわちi番目のストロークのX軸上
の最小値Xs(i)から最大値Xe(i)までの領域の
f(x)の最大値をF4とする。
【0026】つぎに、ヒストグラムの変化量(ヒストグ
ラムの差分の絶対値)の大きさを求る。 g(X)=|dHist(X)|/Max| このときに、i番目のストロークとX軸上で重なってい
る部分、すなわちi番目のストロークのX軸上の最小値
Xs(i)から最大値Xe(i)までの領域のg(X)
の最大値をF5として、この値も特徴とする。
【0027】これらの特徴、F1、F2、F3、F4、
F5の線形結合を用いてストロークの接触可能性の値P
を求める。
【0028】
【数1】 ここで、ωiは重みであり、予めセットされた値を利用
しても良いし、判別分析等の学習で重みを決定すること
もできる。判別分析の学習の方法として一例を挙げるな
らば、例えば、学習を行う際に、接触を起こしているス
トロークの特徴(F1、F2、F3、F4、F5)に対
して「接触ストローク」、と言うカテゴリーを付与し、
接触ストロークのストローク特徴を複数準備する。一
方、接触を起こしていないストロークの特徴(F1、F
2、F3、F4、F5)に対して「非接触ストローク」
と言うカテゴリ−を付与し、非接触ストロークのストロ
ーク特徴を複数準備する。これらのデータを用いて判別
分析で2カテゴリ−識別問題として学習する。すなわ
ち、あるストロークの特徴(F1、F2、F3、F4、
F5)が接触ストロークであるか非接触ストロークであ
るかを判定できるように、ストロークの特徴(F1、F
2、F3、F4、F5)の各要素に対する重みのωi、
すなわちω1、ω2、3、ω4、ω5、を判別分析によ
って決定する。
【0029】また、ストロークの接触可能性の値Pを求
める際には、特徴(F1、F2、F3、F4、F5)を
ニューラルネットに入力して求めることも可能である。
ニューラルネットは“日本工業技術振興協会他:「ニュ
ーロコンピューティングの基礎理論」(海文堂、PP.
48−PP・50、1990)”に示されている方法を
用いることで容易に実現可能である。この場合の学習は
判別分析等で学習する場合と同様に学習可能である。す
なわち、例えば、学習を行う際に、接触を起こしている
ストロークの特徴(F1、F2、F3、F4、F5)に
対して「接触ストローク」と言うカテゴリーを付与し、
接触ストロークのストローク特徴を複数準備する。一
方、接触を起こしていないストロークの特徴(F1、F
2、F3、F4、F5)に対して「非接触ストローク」
と言うカテゴリーを付与し、非接触ストロークのストロ
ーク特徴を複数準備する。ニューラルネットの構造とし
ては、入力層のニューロンはストロークの特徴(F1、
F2、F3、F4、F5)の各要素の値に対応し、中間
層には複数の(例えば5個)ニューロンを用意し、出力
層には2個のニューロンを準備する。ここで、出力層の
一つのニューロンは、接触ストロークの場合に発火し、
もう一方のニューロンは、非接触ストロークの場合に発
火するように、バックプロパゲーション法等でニューラ
ルネットを学習する。最終的にニューラルネットでスト
ロークの接触可能性の値Pを得る際には、接触ストロー
クに対応するニューロンの発火した値(出力値)を接触
可能性の値Pとして用いることができる。ここでは、中
間層に5個のニューロンを用意すると説明したが、中間
層のニューロンの数は任意でも良い。
【0030】また、各特徴の値、F1、F2、F3、F
4、F5を直接用いてルールを作りそのルールによって
ストロークの接触可能性Pを求めることも可能である。
ルールを作るにはさまぎまな方法が考えられるが、一例
を挙げるならば、各特徴の値、Fi(F1、F2、F
3、F4、F5)がFmin(i)以上かつFmax
(i)以下の場合に1/5点づつ点数を与え、これらの
点数の総和をストロークの接触可能性Pとして用いるこ
とも可能である。ここでiは1から5の正の整数であ
る。また、Fmin(i)とFmax(i)の値は予め
定められたパラメータであり、任意の値を用いることが
可能である。
【0031】接触ストローク判別部13では、以上求め
たストロークの接触可能性Pがある閾値よりも大きなス
トロークを接触ストロークであるとして出力する。
【0032】図2の入力パターンの例を挙げて動作を説
明するならば、図3(a)および(b)に示すような1
0個のストロークがそれぞれ接触ストローク判別部13
に入力され、5番目のストロークが接触を起こしている
ストロークと判断されたとすると、5番目のストローク
だけが、ストローク切断部15に送られ、他のストロー
クは非接触ストロークバッファ14に一時的に記憶され
る。
【0033】次に、ストローク切断部15について説明
する。ストローク切断部15は切断候補抽出部15a
と、最適候補選択部15bと、ストローク情報更新部1
5cから成る。切断候補抽出部15aでは、接触してい
ると判断されたストロークに対して切断すべき箇所の候
補をいくつか作成する。切断候補の抽出は、文字列と垂
直方向のラン長の変化が急激な箇所を抽出することで行
われる。例えば、“西脇他:「ラン特徴を用いた接触手
書き数字の切り出し認識」(信学ソ大、D−186、1
995)”を用いて容易に実現することが可能である。
【0034】図2の入力パターンのような入力があった
場合、図5の処理結果のような切断候補が抽出される。
【0035】次に、最適候補選択部15bでは、多数得
られた切断候補のなかから、実際に切断すべき可能性の
高い順に予め決められた候補数、たとえば2個だけ切断
箇所を選択する。ここで候補を選択するには、パターン
全体と切断候補点の位置関係、切断候補点付近における
パターン全体の投影ヒストグラムの値などを用いて決定
する。また、ここでは2個だけ切断箇所を選択すると説
明したが、この数は任意に決めることも可能である。
【0036】切断箇所の選択の方法としては、複数の評
価尺度を用いる。一つは、対象とするストロークの中央
付近になるほど切り出すべき可能性が高いとするパラメ
ータである。図6(a)に示されたi番目の切り出し候
補点Cp(i)のX軸上の位置Xp(i)とストローク
のX軸上の位置関孫から図6(b)の尤度値テーブルに
示されるような尤度値の値をG1(i)に与える。
【0037】この尤度値テーブルは入力パターンのX軸
の中心付近が高い値になり、X軸上での入力パターンの
端になるほど小さな値になるようなものであれば例えば
ガウシアンのような関数を用いることも可能である。
【0038】次にi番目の切り出し候補点Cp(i)の
X軸上の点Xp(i)の近傍における投影ヒストグラム
の値が小さいほど切り出すべき可能性が高いとして近傍
のヒストグラムの値を調べる。投影ヒストグラムをHi
st(X)とし、Hist(X)の最大値をMaxとし
て f(X)=(Max−Hist(X))/Max とする。このときXp(i)±βの範囲におけるf
(x)の最大値をG2(i)として与える。例えば、図
7(b)の投影ヒストグラムの例では鈎括弧aで示され
た領域の切り出すべき可能性が高くなっている。ここで
βは予め与えられた正の数であり、任意に設定すること
が可能である。
【0039】これらの値、G1(i)、G2(i)の線
形結合を用いて切り出し候補点の切り出し可能性の値Q
(i)を求める。
【0040】
【数2】 ここで、ηjは重みであり、予めセットされた値を利用
しても良いし、判別分析等の学習で重みを決定すること
もできる。
【0041】判別分析の学習の方法として一例を挙げる
ならば、例えば、学習を行う際に、切断すべき接触箇所
の特徴(G1(i)、G2(i))に対して「切断実
行」と言うカテゴリーを付与し、切断すべき接触箇所の
特徴を複数準備する。一方、切断すべきでない接触箇所
の特徴(G1(i)、G2(i))に対して「切断非実
行」と言うカテゴリ−を付与し、切断すべきでない接触
箇所の特徴を複数準備する。これらのデータを用いて判
別分析で2カテゴリ−識別問題として学習する。すなわ
ち、あるストロークの特徴(G1(i)、G2(i))
が切断実行であるか切断非実行であるかを判定できるよ
うに、切断候補の接触箇所の特徴(G1(i)、G2
(i))の各要素に対する重みηi、すなわちη1、η
2、を判別分析によって決定する。
【0042】また、切り出し侯補点の切り出し可能性の
値Q(i)を求める際には、特徴(G1(i)、G2
(i))をニューラルネットに入力して求めることも可
能である。ニューラルネットは“日本工業技術振興協会
他;「ニューロコンピューティングの基礎理論」(海文
堂、pp.48−pp・50、1990)”に示されて
いる方法を用いることで容易に実現可能である。この場
合の学習は判別分析等で学習する場合と同様に学習可能
である。すなわち、例えば、学習を行う際に、切断すべ
き接触箇所の特徴(G1(i)、G2(i))に対して
「切断実行」と言うカテゴリーを付与し、切断すべき接
触箇所の特徴を複数準備する。一方、切断すべきでない
接触箇所の特徴(G1(i)、G2(i))に対して
「切断非実行」と言うカテゴリ−を付与し、切断すべき
でない接触箇所の特徴を複数準備する。ニューラルネッ
トの構造としては、入力層のニューロンはストロークの
特徴(G1(i)、G2(i))の各要素の値に対応
し、中間層には複数の(例えば5個)ニューロンを用意
し、出力層には2個のニューロンを準備する。ここで、
出力層の一つのニューロンは、切断実行の場合に発火
し、もう一方のニューロンは、切断非実行の場合に発火
するように、バックプロパゲーション法等でニューラル
ネットを学習する。最終的にニューラルネットで切り出
し候補点の切り出し可能性の値Q(i)を得る際には、
切断実行に対応するニューロンの発火した値(出力値)
を切り出し可能性の値Q(i)として用いることができ
る。ここでは、中間層に5個のニューロンを用意すると
説明したが、中間層のニューロンの数は任意でも良い。
【0043】また、各特徴の値、G1(i)、G2
(i)を直接用いてルールを作りそのルールによって切
り出し候補点の切り出し可能性G(i)を求めることも
可能である。ルールを作るにはさまぎまな方法が考えら
れるが、一例を挙げるならば、各特徴の値、Gj(i)
がMin(j)以上かつMax(j)以下の場合に1/
2点づつ点数を与え、これらの点数の総和をストローク
の接触可能性Q(i)として用いることも可能である。
ここでjは1と2である。
【0044】また、Gmin(j)とGmax(j)の
値は予め定められたパラメータであり、任意の値を用い
ることが可能である。
【0045】最適候補選択部15bではQ(1)からQ
(m)のうち値の大きい順に予め決められた個数の切り
出し箇所を選択する。
【0046】図2の入力パターンのような入力があった
場合、図5の処理結果において、選択された切断箇所に
示されるような切断箇所が選択される。図5の例では2
個の切断箇所が選択されている。
【0047】ストローク情報更新部15cでは、選択さ
れた最適な切断箇所で切断されたストローク情報を作成
する。図2の入力パターンのような入力があった場合、
図8に示されるような新しいストローク1、2、3が作
成される。
【0048】最後に、文字候補作成部16では、非接触
ストロークバッファ14とストローク情報更新部15c
からストローク情報を受け取り、これらの組み合わせを
文字候補として出力する。ストロークを組み合わせて文
字切り出し候補を作成するには、例えば「特願平08−
122333、文字切り出し侯補発生装置」に記載され
ている方法を用いることによって容易に実現可能であ
る。
【0049】本実施形態の文字切り出し候補生成装置で
は、入力された文字列画像からストロークを抽出し、文
字同士が接触したストロークであるかどうかを判別し
て、接触したストロークだけに対して切断候補の探索と
切断処理を行なうので、切断候補の探索と切断処理の回
数を抑えることができる。
【0050】
【発明の効果】以上説明したように本発明は、入力され
た文字列画像からストロークを抽出した後に、文字同士
が接触したストロークであるかどうかを判別して、接触
ストロークだけに対して切断候補の探索と切断処理を行
うことにより、切断候補の探索と切断処理の回数を抑え
ることが可能となり、漢字のような複数な文字に対して
も処理効率を向上するという効果がある。
【図面の簡単な説明】
【図1】本発明の文字切り出し候補作成装置の一実施形
態のブロック図である。
【図2】図1の文字列画像記憶部11に記憶された接触
した文字入力画像の例を示す図である。
【図3】図1の初期ストローク抽出部12の抽出結果を
説明する図であって、(a)は接触ストロークを含まな
い図、(b)は接触ストロークを含む図である。
【図4】図2の入力画像の文字列方向をX軸方向とした
ときのX軸への黒画素の投影ヒストグラムを説明する図
である。
【図5】図1のストローク切断部15の処理結果を説明
する図である。
【図6】図1の最適候補選択部15bの処理の例を説明
する図であって、(a)は接触ストロークを示し、
(b)は尤度値テーブルを示す。
【図7】図1の最適候補選択部15bの処理の他の例を
説明する図であって、(a)は接触ストロークを示し、
(b)は投影ヒストグラムを示す。
【図8】図1のストローク情報更新部15cで作成され
た新しいストロークを説明する図である。
【符号の説明】
1、2、3 新しいストローク 5 接触したストローク 11 文字列画像記憶部 12 初期ストローク抽出部 13 接触ストローク判別部 14 非接触ストロークバッファ 15 ストローク切断部 15a 切断候補抽出部 15b 最適候補選択部 15c ストローク情報更新部 16 文字候補作成部 a 領域
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06K 9/34 JICSTファイル(JOIS) JICSTファイル(JQUICK)

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】 手書き文字列の画像を入力して文字の切
    り出し候補を求める文字切り出し候補生成装置におい
    て、 光学的に走査された文字列画像を入力して記憶する文字
    列画像記憶部と、 前記文字列画像記憶部から前記文字列画像を入力して初
    期ストロークを抽出する初期ストローク抽出部と、 前記初期ストローク抽出部によって抽出された初期スト
    ロークが接触したストロークかどうかを判定する接触ス
    トローク判別部と、 前記接触ストローク判別部において接触していないと判
    定された初期ストロークを一時的に記憶する非接触スト
    ロークバッファと、 前記接触ストローク判別部において接触していると判定
    された前記初期ストロークを切断して更新されたストロ
    ークを作成するストローク切断部と、 前記非接触ストロークバッファと前記ストローク情報更
    新部からそれぞれ前記初期ストロークと前記更新された
    ストロークを入力して、それらの幾つかの組み合わせを
    作成することによって文字切り出し候補を生成する文字
    切り出し候補作成部とを備えることを特徴とする文字切
    り出し候補生成装置。
  2. 【請求項2】 前記ストローク切断部は、 接触していると判断された前記初期ストロークに対する
    切断候補となる箇所を抽出する切断候補抽出部と、 前記切断侯補から実際に切断するべき箇所を幾つか切断
    箇所として選択する最適候補選択部と、 前記接触していると判断された前記初期ストロークを前
    記切断箇所で切断して新しいストロークを作成するスト
    ローク情報更新部とを有する請求項1記載の文字切り出
    し候補生成装置。
  3. 【請求項3】 前記接触ストローク判別部は、前記初期
    ストロークの長さと入力された前記文字列画像の大きさ
    との関係と、入力された前記文字列画像の投影ヒストグ
    ラムと前記初期ストロークの位置の関係を用いて複数の
    評価尺度を用いて前記初期ストロークの接触可能性を算
    出する請求項1または2記載の文字切り出し候補生成装
    置。
  4. 【請求項4】 前記初期ストロークの接触可能性を算出
    する際の基準が学習によって作成された基準である請求
    項3記載の文字切り出し候補生成装置。
  5. 【請求項5】 前記最適候補選択部は、多数得られた前
    記切断候補のなかから、実際に切断すべき可能性の高い
    順に予め決められた候補数を選択する際に、前記文字列
    全体と前記切断候補点の位置関係、前記切断候補点付近
    における前記文字列全体の投影ヒストグラムの値を用い
    て選択する請求項2ないし4のいづれか1記載の文字切
    り出し候補生成装置。
  6. 【請求項6】 前記最適候補選択部は、前記切断候補の
    切断すべき可能性を算出する際の基準が学習によって作
    成された基準である請求項5記載の文字切り出し候補生
    成装置。
JP9318638A 1997-11-19 1997-11-19 文字切り出し候補生成装置 Expired - Fee Related JP2976954B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9318638A JP2976954B2 (ja) 1997-11-19 1997-11-19 文字切り出し候補生成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9318638A JP2976954B2 (ja) 1997-11-19 1997-11-19 文字切り出し候補生成装置

Publications (2)

Publication Number Publication Date
JPH11149521A JPH11149521A (ja) 1999-06-02
JP2976954B2 true JP2976954B2 (ja) 1999-11-10

Family

ID=18101381

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9318638A Expired - Fee Related JP2976954B2 (ja) 1997-11-19 1997-11-19 文字切り出し候補生成装置

Country Status (1)

Country Link
JP (1) JP2976954B2 (ja)

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
情報処理学会第55回(平成9年後期)全国大会講演論文集(2) 1K−4,石寺、西脇、山田,「ストローク抽出に基づく文字切り出しの一検討」

Also Published As

Publication number Publication date
JPH11149521A (ja) 1999-06-02

Similar Documents

Publication Publication Date Title
KR100248917B1 (ko) 패턴인식장치및방법
JPH1139493A (ja) 距離及び方向に鑑みたパターン整合装置及びその方法
CN110866529A (zh) 字符识别方法、装置、电子设备及存储介质
JP4300098B2 (ja) オブジェクト識別方法とその装置、プログラム及び記録媒体
Boussellaa et al. Unsupervised block covering analysis for text-line segmentation of Arabic ancient handwritten document images
JP2007025902A (ja) 画像処理装置、画像処理方法
JP2007058882A (ja) パターン認識装置
JP2015099566A (ja) 特徴算出装置、方法及びプログラム
Ramdan et al. A novel method to detect segmentation points of arabic words using peaks and neural network
JP2976954B2 (ja) 文字切り出し候補生成装置
JPH1166238A (ja) 手書き文字認識方法
JP4176175B2 (ja) パターン認識装置
Luo et al. Offline Chinese handwriting character recognition through feature extraction
JP2853168B2 (ja) パターン認識装置
JPH01271883A (ja) 指紋中心検出方式
JP3213403B2 (ja) 手書き情報処理装置および手書き情報処理方法
JP4026738B2 (ja) パターン認識方法及び装置、並びに記録媒体
JP2006277149A (ja) 文字画像切出装置、文字画像切出方法およびプログラム
JP3209197B2 (ja) 文字認識装置及び文字認識プログラムを記録した記録媒体
JP3077929B2 (ja) 文字切出し方式
JP2812391B2 (ja) パターン処理方法
JP2853169B2 (ja) パターン認識装置
JP3711186B2 (ja) サイズ識別方法および装置
JP2671984B2 (ja) 情報認識装置
JP2007026470A (ja) パターン認識装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080910

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080910

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090910

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090910

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100910

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees