JPH0676114A - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JPH0676114A
JPH0676114A JP4226185A JP22618592A JPH0676114A JP H0676114 A JPH0676114 A JP H0676114A JP 4226185 A JP4226185 A JP 4226185A JP 22618592 A JP22618592 A JP 22618592A JP H0676114 A JPH0676114 A JP H0676114A
Authority
JP
Japan
Prior art keywords
partial
character
character string
characters
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4226185A
Other languages
English (en)
Other versions
JP3260843B2 (ja
Inventor
Hirofumi Nishida
広文 西田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP22618592A priority Critical patent/JP3260843B2/ja
Priority to US08/111,461 priority patent/US5497432A/en
Publication of JPH0676114A publication Critical patent/JPH0676114A/ja
Application granted granted Critical
Publication of JP3260843B2 publication Critical patent/JP3260843B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 文字列画像全体の構造的な情報を用いて、接
触文字数、接触の仕方に関係なく文字列を容易に認識す
る。 【構成】 処理は、手書き文書等を入力する処理10
0、入力文書画像から文字列を抽出する処理110、文
字列を認識する処理120に大別される。文字列認識処
理では、まず、抽出された文字列画像を細線化して骨格
線図形を生成する(121)。次に、骨格線図形を複数
の単純な部分曲線に分割する(122)。次に、部分曲
線を組合せて文字列の部分図形を生成し、該部分図形に
ついて文字認識を行う(123)。次に、文字に認識さ
れた部分図形をノードとし、該ノードを重み付きのリン
クで多様に結んでネットワークを構成する(124)。
最後に、ネットワークから最適解の経路を選び、そのノ
ードの組合せを出力する(125)。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文字認識方法に係り、特
に複数文字の接触した手書き文字列等の認識に最適な文
字認識方法に関する。
【0002】
【従来の技術】フリーフォーマットの手書き文字を認識
する場合、2つ以上の文字の接触という問題が起こる。
この問題に対処する従来技術方法としては、次のような
方法が知られている。
【0003】(a)垂直方向の射影ヒストグラムの極小
点を文字の分離位置の候補点とする方法(文献2)。
【0004】(b)2文字が接触している場合に、その
2文字を最適に分離する直線を、画素の2次元的分布に
対して、判別分析法を用いて検出する方法(文献1)。
【0005】(c)輪郭追跡し、接触文字画像の上輪郭
の谷と下輪郭の頂点を結ぶことにより、2文字を分離す
る方法(文献2)。
【0006】(d)接触文字画像の上輪郭の谷から出発
して、もし、現在位置(画素)が黒であるか、または、
その左右両隣の画素がどちらも黒か、どちらも白である
ときには、1ピクセル下に移動する方法(文献2)。な
お、それ以外の時は、片方に黒があり、別な方に白があ
る。そのような場合には、黒画素の方向に1ピクセルだ
け横に移動する。
【0007】(e)接触文字画像の下輪郭の頂点から出
発して、もし、現在位置(画素)が黒であるか、また
は、その左右両隣の画素がどちらも黒か、どちらも白で
あるときには、1ピクセル上に移動する方法(文献
2)。この場合も、それ以外の時は、片方に黒があり、
別な方に白がある。そのような場合には、黒画素の方向
に1ピクセルだけ横に移動する。
【0008】(f)接触文字画像の上輪郭と下輪郭の高
さの差が、急激に変わる点(一般には小さくなる点)を
分離候補点とする方法(文献3)。
【0009】(g)接触文字画像の上輪郭にループの極
大点に対応する2つの頂点があり、かつ、下輪郭にルー
プの極小点に対応する2つの谷があるときに、上輪郭上
の2つの頂点の間に谷があり、下輪郭上の2つの谷の間
に頂点があるならば、これらの上輪郭の谷と下輪郭の頂
点を結んで、ループの接触を分離する方法(文献3)。
【0010】<文献> 1.F.Kimura and M.Shridha
r,“Recognition of connect
ed numeral strings,”inPro
ceedings of First Interna
tional Conference on Docu
ment Analysis and Recogni
tion,Saint Malo ,France,S
ept.30−Oct.1,1991,pp.731−
739. 2.R.Fenrich,“Segmentation
of automatically located
handwritten words,”inPro
ceedings of Second Intern
ationalWorkshop on Fronti
ers in Handwriting recogn
ition,Bonas,France,Sept.2
3 −27,1991,pp.33−44. 3.藤原、道野、「接触した手書文字の自動分離を行う
文字切り出し方式」、昭和59年電子通信学会総合全国
大会、No.1588,1984.
【0011】
【発明が解決しようとする課題】手書き文字の接触に固
有な問題は、図16の「5」と「7」のように、互いに
入り組んで接触することが多く、分離位置を簡単に直線
を引くことにより決めもことができないことである。上
記従来の方法は、射影(a)、画素分布(b)、上・下
輪郭(c),(f),(g)のような、統計的特徴や、
画像の周辺の情報のみを使っており、内部の入り組んだ
構造に対する情報し使っていない。そのため、これらの
方法では、様々な複雑な後処理を施すことによって、入
り組んだ接触に対処している。(d)と(e)では、内
部の情報を使おうとしているが、ヒューリスティックの
みに頼った方法のため、信頼性や拡張性が明確でない。
また、文献(2)のように、接触の仕方によって、
(a)から(g)の方法を組み合わせて使うことも行な
われているが、いくつかの方法を並列的に走らせるため
に、処理量とプログラム容量が大きくなり、かつ、複数
の方法から幾通りかの答えが出てきた場合に、いかに答
えを統合して決定を下すかが問題となる。また、これら
の方法は基本的に2文字の接触を仮定しているので、3
文字以上の接触に対しては、手続きを再帰的に適用する
ことにより対処せざるを得なかった。
【0012】本発明の目的は、上輪郭や下輪郭のような
文字列画像の周辺の情報ではなく、文字列画像全体の構
造的な情報を用いた、あらゆる接触の仕方に対応でき、
接触している文字も2つに限らず、いくつの場合にも適
用できる、構成する文字の数が不明あるいは既知の文字
列画像を容易に認識する方法を提供することにある。
【0013】
【課題を解決するための手段】上記目的を達成するため
に、請求項1の発明の文字認識方法は、入力された文字
列画像を細線化する処理と、前記細線化して得られる骨
格線図形を複数の単純な部分曲線に分割する処理と、前
記部分曲線を組合せて文字列の部分図形を生成し、各部
分図形について文字認識を行う処理と、文字として認識
された部分図形をノードとし、該ノード間を重み付きの
リンクで多様に結ぶネットワークを構成する処理と、前
記ネットワークから最適経路を選び、そのノードの認識
文字の組合せを出力する処理とからなることを特徴とす
る。
【0014】また、請求項2の発明は、上記請求項1記
載の文字認識方法において、構成する文字の数が既知の
文字列の場合、ネットワークについて、その構成するノ
ードの数が与えられた文字の数と一致する中から全体と
して最適経路のものを選ぶことを特徴とする。
【0015】さらに、請求項3の発明は、上記請求項1
もしくは2記載の文字認識方法において、骨格線図形を
部分曲線に分割する際に、部分的に分割の仕方を細かく
することを特徴とする。
【0016】
【作用】入力文字画像を細線化して得られた骨格線図形
を分岐点や端末点で分解し、単純弧や単純閉曲線などの
複数の部分曲線に分割する。この際、分岐点や、交差点
無しに、2つの文字が接触しているような、微妙な接触
が起こっている可能性が高い場合には、その付近の分解
の仕方を他の箇所よりも細かくする。これらの部分曲線
をあらためて組合せて文字列の部分図形を生成し、認識
処理を行い、文字に認識された部分図形だけを集めてネ
ットワークを構成する。このようにして、文字列骨格線
から得られる様々な部分図形を認識結果の組合せの中か
ら、全体として最適なものを選び、それを認識結果とす
る。これにより、接触文字数、接触の仕方、あるいは文
字の接触の有無に関係なく、文字列画像を認識できるこ
とになる。
【0017】
【実施例】以下、本発明の一実施例について図面により
詳述する。
【0018】図2は本発明を達成するハードウエア構成
の概略ブロック図である。図2において、画像入力装置
10はスキャナなどからなり、手書き文書などを読み取
る。この読み取られた文書は、黒画素が1、白画素が0
の2値画像情報として画像メモリ20に格納される。画
像処理装置30は、画像メモリ20の画像情報を読み出
して種々の処理を行う。本発明では、後述の図1の処理
を行う。ワークメモリ40は画像処理装置30の作業用
メモリとして用いられる。また、ファイルメモリ50は
画像処理装置30での最終的処理結果や認識で必要な各
種の辞書類を格納するのに用いられる。
【0019】図1は、本発明の一実施例の全体の処理手
順を示したものである。処理は、画像入力処理100、
文字列(単語)抽出処理110及び文字列(単語)認識
処理120に大別される。また、文字列認識処理120
は細線化処理121、曲線分割処理122、部分認識処
理123、ネットワーク構成処理124、最適解探索処
理125からなり、さらに、部分認識処理123は部分
図形生成処理123−1と文字認識処理123−2から
なる。
【0020】画像入力処理100では、画像入力装置1
0により手書き文書などを2値画像情報として読み取
る。文字列抽出処理110では、射影などの方法を用い
て、入力文書画像から一塊りの文字列(単語)を抽出す
る。これらは従来の方法をそのまま利用すればよいの
で、これ以上の説明は省略する。以下では、本発明の中
心をなす文字列認識処理130について具体例によって
説明する。
【0021】<細線化処理>細線化処理121では、抽
出した文字列(単語)の細線化を行うと共に、その骨格
線データから文字列の幅(W)と高さ(H)を求める。
例えば、図3のような文字列画像から図4のような骨格
線図形が生成される。図4の場合、W=108,H=4
1である。以下、図4のように、文字列の骨格線を囲む
最小の直立長方形の、左下の角が原点(0,0)、右上
の角が(W,H)になるようにXY座標軸を取る。
【0022】<曲線分割処理>曲線分割処理122で
は、細線化処理12で得られた骨格線図形を、まず、分
岐点や端末で分解する。例えば、図4の場合には、図5
に示すように、0から10までの11個の単純弧(0〜
8、10)、または、単純閉曲線(9)に分解される。
【0023】次に、分解の結果得られた単純弧、単純閉
曲線に対して、それぞれ、その上の点のX座標の最大値
(Xmax)と最小値(Xmin)を求める。ここで、
Xmax−Xminが文字列の高さHに比べて大きいと
きには、図3の2つの文字「4」と「5」のように、分
岐点や、交差点無しに、2つの文字が接触している可能
性が高い。そこで、その単純弧、単純閉曲線に対して、 Xmax−Xmin>a・H (1) であれば、その単純弧を適当に分解する。なお、aは、
予め与えられている正のパラメータで、0.5〜1.0
である。例えば、a=0.6とすると、図5の場合、単
純弧6と単純閉曲線9が(1)式を満たすので、さらに
図6のように分解される。ここで、図6において、分割
点を点で示す。この結果、図4の骨格図形線について、
図6のように、19個の単純弧が得られる。これらの各
々を「枝」とよぶ。図6では、19個の枝が得られる。
【0024】これらの枝を、X座標の中心の値(Xma
x−Xmin)/2で、順序づける。この値が同じもの
に対しては、Xminで順序づける。図6の番号0〜1
8は、この規則によって割り当てたものである。各々の
枝は、その上の点のX座標、Y座標の最小・最大値(X
min,Xmax,Ymin,Ymax)、長さ、そし
て、その上の点の座標情報を持つ。図7は、図6の枝0
〜18に対して、Xmin,Xmax,Ymin,Ym
ax,長さを示したものである。
【0025】<部分認識処理>部分認識処理123は、
部分図形生成処理123−1と文字認識処理123−2
からなる。
【0026】部分骨格線生成処理123−1では、2つ
の整数のパラメータ「s」と「e」(ただし、s≦e)
を与えられて、s番目からe番目までの枝の上にある点
を取ってきて、図4に示されているような骨格図形の部
分図形を生成する。ここで、効率化のために、以下の
(a)と(b)のように、文字列の高さに比べて、その
幅が十分小さくて、かつ、その高さが十分大きい、部分
図形のみを作る。
【0027】(a)e番目の枝のX座標の最大値Xma
x(e)が、s番目の枝のX座標の最小値Xmin
(s)に対して、 Xmax(e)>Xmin+b・H (2) であれば、部分図形を作らないことにする。なお、b
は、予め与えられている正のパラメータで、1.5〜
2.0とする。(b)s番目からe番目までの枝から作
られる部分図形のY座標の最小値と最大値を、図7のよ
うな表から探してきて、それらを、それぞれ、Y0、Y
1とするとき、 Y1−Y0<b′・H (3) であれば、部分図形を作らないことにする。なお、b’
は、予め与えられている正のパラメータで、0.3〜
0.8とする。言い換えると、 Xmax(e)≦Xmin(s)+b・H,かつ、Y1
−Y0≧b’・H のときにだけ、部分図形を作る。図6について、部分図
形生成処理123−1で作られる部分図形の例を挙げる
と、図8乃至図10のようになる。図中、例えば「0−
2」は、「0」がs(スタート)番目の枝、「2」がe
(エンド)番目の枝を意味する。また、「X」印のもの
は、一応部分骨格線と考えることができるが、生成の対
象としない例である。
【0028】文字認識処理123−2では、部分図形生
成処理123−1で作られた部分図形を認識し、候補文
字と標準パターンからの距離を出力する。認識方法は従
来から提案されている方法のいずれを用いてもよいが、
例えば特開平3−108079号公報に記載の認識方法
でもよい。距離は0〜1の間に正規化されているとす
る。図8乃至図10の部分図形(×印以外のもの)に対
して、ある文字に認識されたもの(リジェクトされなか
ったもの)だけをまとめてみると、図11のように12
個になる。ここで、番号は、部分図形の番号、枝番号
は、上記のsとeに相当し、Xmin,Xmax,Ym
in,Ymaxは、その部分図形のX,Y座標の最小・
最大値、長さは、その部分図形の線の長さ、文字コード
は認識結果、距離は標準パターンからの距離、そして、
スコアは、(距離)×(長さ)で計算されたものであ
る。部分図形の番号は、上記のsの値が小さい順に、s
の値が同じものに対しては、eの値が小さい順に付けら
れるとする。
【0029】<ネットワーク構成処理>ネットワーク構
成処理124では、ある文字に認識された部分図形のネ
ットワークを次のように構成する。ネットワークにおい
ては、ROOTとENDと呼ばれる特殊なノードと、各
部分図形に対応するノードがある。各部分図形に対応す
るノードには、対応する部分図形の番号0,1,…,N
n−1(Nnは認識された部分図形の数)が付けられ
る。
【0030】次に、部分図形に対応する2つのノード間
のリンクを次のようにして張る。iとj(ただし、i<
j)を、部分図形の番号とする。また、s(i),e
(i)をそれぞれ、部分図形iの先頭と最後の枝の番
号、Xmin(i),Xmax(i),Ymin
(i),Ymax(i)を、それぞれ、部分図形iの
X,Y座標の最小・最大値とする。s(j),e
(j),Xmin(j),Xmax(j),Ymin
(j),Ymax(j)も、同様に定義する。そして、
次の条件を満足するときに、ネットワークのノードiと
jを、i→jのように、向き付きのリンクでつなぐ。 1.e(i)≦s(j) 2.Xmax(i)−Xmin(j)<c・H(cは、
予め与えられている正のパラメータで、0.2〜0.
4)。これは、部分図形iとjの横方向の重なりが、大
きすぎないことを要求するものである。 3.Xmin(i)+d・H>Xmin(j)(dは、
予め与えられている正のパラメータで、1.5〜2.
5)。これは、部分図形iとjが横方向に離れ過ぎてい
ないことを要求するものである。 4.dyを2つの部分図形iとj要同時に囲む最小の直
立長方形の高さ、oyを、部分図形iを囲む最小の直立
長方形と、部分図形jを囲む最小の直立長方形の交わり
の部分の高さとする。もし、Xmax(i)≧Xmin
であれば、oy>の交わりの部分の高さとする。もし、
Xmax(i)≧Xmin(j)であれば、oy>f・
dy(fは、予め与えられている正のパラメータで、
0.5〜0.9)でなければならない。これは、部分図
形iとjが横方向に接触しているか、または、多なって
いる場合、iとjの高さと縦方向の位置がほぼ等しいこ
とを要求するものである。
【0031】さらに、リンクに対して、重みを次のよう
に与える。 1.e(i)=s(j)、または、e(i)+1=s
(j)のときは0。 2.e(i)+1<s(j)のときは、e(j)+1番
目から、s(j)−1番目までの枝の長さの総和。
【0032】ROOTノードから、部分図形に対応する
ノードiへのリンクROOT→iは、Xmin(i)<
d・W(dは上記のパラメータ)のときのみ張る。ま
た、部分図形に対応するノードiから、ENDノードへ
のリンクi→ENDは、Xmax(i)>(1−d)・
Wのときのみ張る。
【0033】いま、枝がNb個あり、それぞれ、0から
Nb−1までの番号が付けられているとする。リンクR
OOT→iの重みは、s(i)=0のとき0、それ以外
の時は、0番目からs(i)−1番目までの枝の長さの
総和として与えられる。リンク→ENDの重みは、e
(i)−Nb−1のとき0、それ以外の時は、e(i)
+1番目からNb−1までの枝の長さの総和として与え
られる。
【0034】図11の例について、ネットワーク構成を
示すと図12のようになる。この例では、Nn=12で
ある。また、図13に、このようにして構成された重み
付け有向ネットワークを表形式で示す。
【0035】<最適解探索処理>最適解探索処理125
では、いわゆる動的計画法(ダイナミックプログラミン
グ)を適用し、ネットワーク構成処理124で求った有
向ネットワークについて、ROOTノードからENDノ
ードに至る経路を縦型探索して文字列を認識する。ここ
で、ROOTからENDに至る経路(ROOT,N
(1),N(2),…,N(m),END)において
(N(i),i=1,2,…,m,は対応する部分図形
の番号)、次の2つを評価関数として用いる。
【0036】(1)部分図形N(i)(i=1,2,
…,m)のスコア(=(認識された標準パターンから距
離)×(部分図形の線の長さ))の和S。 (2)経路上のリンクROOT→N(1),N(2),
…,N(m−1)→N(m),N(m)→ENDに付け
られた重みの総和U。
【0037】ここでは、Uを最小にする経路を見つけ、
もし、Uを最小にする経路が幾通りかあった場合には、
Sを最大にするものを選ぶ。また、Uに対しては、許容
範囲を、U0=g・L(Lは骨格線の総長、gは、予め
与えられている正のパラメータで、0〜0.2)以下と
する。もしも、選ばれた経路において、Uの最小値がU
0以下であった場合には、部分図形N(i)(i=1,
2,…,m)の認識結果を順にならべて、文字列の認識
結果として出力し、U0より大きければ、結果として、
「リジェクト」を出力する。
【0038】ネットワークの縦型探索の際には、経路
(ROOT,n(1),n(2),…,n(k))にお
いて(n(i),i=1,2,…,k,は対応する部分
図形の番号)、現在、たどり着いているノードn(k)
と、経路上でn(k)より前のあるノードn(1),n
(2),…,n(k−1)に対して、次の条件を調べ
る。ここで、s(i),e(i)をそれぞれ、部分図形
iの先頭と最後の枝の番号、Xmin(i),Xmax
(i),Ymin(i),Ymax(i)を、それぞ
れ、部分図形iのX,Y座標の最小・最大値とする。 a.経路上のリンクROOT→n(1),n(1)→n
(2),…,n(m−1)→n(m)→ENDに付けら
れた重みの総和をU(k)とする。もし、U(k)>U
0=g・Lであれば、リンクに付けられた重みが0、ま
たは、正であるので、そのノードから先の縦型探索を行
なっても、評価関数Uの値は、U0以下になることはな
い。そこで、そのような場合には、探索を効率良く行な
うために、ノードn(k)から先の縦型探索をやめる。 b.あるi=1,2,…,k−1に対して、e(n
(i))>s(n(k))であれば、ノードn(k)か
ら先の縦型探索をやめる。 c.あるi=1,2,…,k−1に対して、Xmax
(n(i)−Xmin(n(k)≧c・Hであれば、ノ
ードn(k)から先の縦型探索をやめる(cは、上記の
パラメータ)。 d.あるi=1,2,…,k−1に対して、Xmin
(n(i)+d・H≦Xmin(n(k))であれば、
ノードn(k)から先の縦型探索をやめる(dは、上記
パラメータ)。 e.dy(i)を2つの部分図形n(i)(i=1,
2,…,k−1)とn(k)を同時に囲む最小の直立長
方形の高さ、oy(i)を、部分図形n(i)(i=
1,2,…,k−1)を囲む最小の直立長方形と、部分
図形n(k)を囲む最小の直立長方形の交わり部分の高
さとする。あるi=1,2,…,k−1に対して、も
し、Xmax(n(i))≧Xmin(n(k))、か
つ、oy(i)≦f・dy(i)であれば、ノードn
(k)から先の縦型探索をやめる(fは、上記のパラメ
ータ)。
【0039】図12及び図13の例の場合、図14に示
すような経路が答えとして得られ、U=0,S=76.
43となり、文字列の認識結果として、部分図形0,
2,5,9の認識結果を並べた「3456」が出力され
る。見方をかえれば、経路上のノードに対応する部分図
形を使って、図4の文字列の骨格線が、図15のよう
に、4つに切り分けられたことになる。
【0040】なお、文字列中の文字の数が既知の場合に
は、上記のmがその文字の数と一致するものの中で、U
を最小にする経路を見つけ、もし、Uを最小にする経路
が幾通りかあった場合には、Sを最大にするものを選
ぶ。もしも、選ばれた経路において、Uの最小値がU0
以下であった場合には、その中で、Sを最大にするもの
について、部分図形N(i)(i=1,2,…,m)の
認識結果を順にならべて、文字列の認識結果として出力
し、U0より大きければ、結果として、「リジェクト」
を出力する。
【0041】また、文字列中の文字の数が既知の場合、
ネットワークの縦型探索の際には、経路(ROOT,n
(1),n(2),…,n(k)において(n(i),
i=1,2,…,k,は対応する部分図形の番号)、現
在、たどり着いているノードn(k)と、経路上でn
(k)より前のあるノードn(1),n(2),…,n
(k−1)に対して、上記した条件とともに、次の条件
を調べる。kが、与えられた文字数より大きければ、ノ
ードn(k)から先の縦型探をやめる。
【0042】図16乃至24に、本発明による文字列認
識処理の別の具体例を示す。
【0043】図16は、入力文字列画像であり、「5」
と「7」、「7」と「9」が接触している例である。こ
のような文字列画像から、図17のような骨格線図形を
生成する。そして、この骨格線データから、文字列の幅
(W)と高さ(H)を求める。例えば、図17の例で
は、W=79,H=42であるとする。
【0044】図18は、図17の骨格線図形から得られ
る枝で、ここでは、0〜9の10個の枝が得られる。図
19は、図18の枝0〜9に対して、その上の点のX座
標、Y座標の最小・最大値(Xmin,Xmax,Ym
in,Ymax)、長さを表にしたものである。
【0045】図18の枝0〜9から部分図形を生成し、
各部分図形に対して、ある文字に認識されたもの(リジ
ェクトされなかったもの)だけをまとめてみると、図2
0のように6個になる。図20の意味は図11と同様で
あり、スコアは(距離)×(長さ)で計算されたもので
ある。
【0046】図12及び図22は、図20の部分図形に
対する重み付け有向ネットワークを示したものである。
図23は、そのネットワークの探索によって得られた最
適経路で、U=0,S=77.55となり、文字列の認
識結果として、部分図形,2,4,5の認識結果を並べ
た、「5791」が出力される。また、経路上のノード
に対応する部分図形を使って、図17の文字列の骨格線
を、図24のように、4つに切り分けることができる。
【0047】
【発明の効果】請求項1の発明では、接触文字数、接触
の仕方、あるいは、文字の接触の有無に関係なく、構成
する文字の数が不明な文字列画像でも容易に認識するこ
とが可能である。
【0048】請求項2の発明では、構成する文字の数が
既知の文字列画像を同様に容易に認識することが可能で
ある。
【0049】請求項3の発明では、分岐点や、交差点無
しに、2つの文字が接触しているような、接触の仕方が
微妙な場合でも、複雑な後処理を施すことなく容易に文
字を認識することが可能である。
【図面の簡単な説明】
【図1】本発明の全体的処理手順の一実施例を示す図で
ある。
【図2】図1の処理を実行するハードウエア構成例の概
略ブロック図である。
【図3】認識対象の文字列画像の一例を示す図である。
【図4】図3の文字列画像の骨格線図形を示す図であ
る。
【図5】図4の骨格線図形を単純弧や単純閉曲線に分解
した図である。
【図6】図4の骨格線図形を最終的に部分曲線に分割し
た図である。
【図7】図6の各部分曲線のリストを表形式で示した図
である。
【図8】図6の部分曲線から生成される部分図形の一例
を示す図である。
【図9】図8の続きの図である。
【図10】図9の続きの図である。
【図11】図8乃至図10の部分図形のうち、文字と認
識された部分図形のリストを表形式で示した図である。
【図12】図11の文字と認識された部分図形のネット
ワーク構成を示す図である。
【図13】図13のネットワーク構成を表形式で示した
図である。
【図14】図12のネットワーク構成の最適解探索結果
を示す図である。
【図15】図14に対応する認識結果の文字列を示す図
である。
【図16】認識対象の文字列画像の他の例を示す図であ
る。
【図17】図16の文字列画像の骨格線図形を示す図で
ある。
【図18】図17の骨格線図形を部分曲線に分割した図
である。
【図19】図18の各部分曲線のリストを表形式で示し
た図である。
【図20】図6の部分曲線から生成された部分図形のう
ち、文字と認識された部分図形のリストを表形式で示し
た図である。
【図21】図20の文字と認識された部分図形のネット
ワーク構成を示す図である。
【図22】図21のネットワーク構成を表形式で示した
図である。
【図23】図21のネットワーク構成の最適解探索結果
を示す図である。
【図24】図23に対応する認識結果の文字列を示す図
である。
【符号の説明】
100 文字画像入力処理 110 文字列抽出処理 120 文字列認識処理 121 細線化処理 122 曲線分割処理 123 部分認識処理 124 ネットワーク構成処理 125 最適解探索処理

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 入力された文字列画像を細線化する処理
    と、前記細線化して得られる骨格線図形を複数の単純な
    部分曲線に分割する処理と、前記部分曲線を組合せて文
    字列の部分図形を生成し、各部分図形について文字認識
    を行う処理と、文字として認識された部分図形をノード
    とし、該ノード間を重み付きのリンクで多様に結ぶネッ
    トワークを構成する処理と、前記ネットワークから最適
    経路を選び、そのノードの認識文字の組合せを出力する
    処理とからなることを特徴とする文字認識方法。
  2. 【請求項2】 請求項1記載の文字認識方法において、
    構成する文字の数が既知の文字列の場合、ネットワーク
    について、その構成するノードの数が与えられた文字の
    数と一致する中から全体として最適経路のものを選ぶこ
    とを特徴とする文字認識方法。
  3. 【請求項3】 請求項1もしくは2記載の文字認識方法
    において、骨格線図形を部分曲線に分割する際に、部分
    的に分割の仕方を細かくすることを特徴とする文字認識
    方法。
JP22618592A 1992-08-25 1992-08-25 文字認識方法 Expired - Lifetime JP3260843B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP22618592A JP3260843B2 (ja) 1992-08-25 1992-08-25 文字認識方法
US08/111,461 US5497432A (en) 1992-08-25 1993-08-23 Character reading method and apparatus effective for condition where a plurality of characters have close relationship with one another

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP22618592A JP3260843B2 (ja) 1992-08-25 1992-08-25 文字認識方法

Publications (2)

Publication Number Publication Date
JPH0676114A true JPH0676114A (ja) 1994-03-18
JP3260843B2 JP3260843B2 (ja) 2002-02-25

Family

ID=16841225

Family Applications (1)

Application Number Title Priority Date Filing Date
JP22618592A Expired - Lifetime JP3260843B2 (ja) 1992-08-25 1992-08-25 文字認識方法

Country Status (2)

Country Link
US (1) US5497432A (ja)
JP (1) JP3260843B2 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07273922A (ja) * 1994-03-30 1995-10-20 Matsushita Electric Ind Co Ltd Fax情報転送装置
JP2005182660A (ja) * 2003-12-22 2005-07-07 Matsushita Electric Works Ltd 文字・図形の認識方法
JP2007058304A (ja) * 2005-08-22 2007-03-08 Toshiba Corp 文字認識装置及び文字認識方法
JP2009259291A (ja) * 2000-11-01 2009-11-05 Fujitsu Ltd 文字認識方法,プログラム及び記録媒体
JP2011146028A (ja) * 2010-01-18 2011-07-28 Fujitsu Ltd 文字認識方法及び文字認識装置
JP2012118650A (ja) * 2010-11-30 2012-06-21 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
US9031324B2 (en) 2013-03-19 2015-05-12 Brother Kogyo Kabushiki Kaisha Image-processing device specifying encircling line for identifying sub-region of image
US9558433B2 (en) 2015-06-30 2017-01-31 Brother Kogyo Kabushiki Kaisha Image processing apparatus generating partially erased image data and supplementary data supplementing partially erased image data
JP2018060389A (ja) * 2016-10-06 2018-04-12 アイラボ株式会社 プログラム、情報記憶媒体及び文字分割装置

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5727081A (en) * 1991-12-31 1998-03-10 Lucent Technologies Inc. System and method for automated interpretation of input expressions using novel a posteriori probability measures and optimally trained information processing networks
JP3260979B2 (ja) * 1994-07-15 2002-02-25 株式会社リコー 文字認識方法
JP2741575B2 (ja) * 1994-09-22 1998-04-22 日本アイ・ビー・エム株式会社 文字認識文字補完方法及びコンピュータ・システム
US6208744B1 (en) * 1994-12-14 2001-03-27 Casio Computer Co., Ltd. Document image processor and method for setting a document format conforming to a document image
JP2939147B2 (ja) * 1994-12-29 1999-08-25 シャープ株式会社 手書き文字入力表示装置および方法
US6246794B1 (en) * 1995-12-13 2001-06-12 Hitachi, Ltd. Method of reading characters and method of reading postal addresses
JP3815704B2 (ja) 1997-10-28 2006-08-30 株式会社リコー 図形分類処理方法、図形検索処理方法、図形分類システム、図形検索システム、図形分類用特徴抽出処理方法、図形分類用表作成処理方法、情報記録媒体、図形間の類似度又は相異度の評価処理方法、図形正規化処理方法、及び、図形間対応付け処理方法
JP2882404B1 (ja) * 1997-12-17 1999-04-12 日本電気株式会社 手書き符号処理装置
KR100413679B1 (ko) * 2000-10-21 2003-12-31 삼성전자주식회사 형상 기술자 추출방법
JP4169522B2 (ja) * 2002-03-22 2008-10-22 株式会社リコー 画像処理装置、画像処理プログラム及びこのプログラムを記憶する記憶媒体
JP4118749B2 (ja) * 2002-09-05 2008-07-16 株式会社リコー 画像処理装置、画像処理プログラムおよび記憶媒体
US20040146200A1 (en) * 2003-01-29 2004-07-29 Lockheed Martin Corporation Segmenting touching characters in an optical character recognition system to provide multiple segmentations
JP4259949B2 (ja) 2003-08-08 2009-04-30 株式会社リコー 画像作成装置、画像作成プログラムおよび記録媒体
CN102385707A (zh) * 2010-08-30 2012-03-21 阿里巴巴集团控股有限公司 一种数字图像识别的方法、装置及爬虫服务器
TWI478074B (zh) * 2010-12-01 2015-03-21 Inst Information Industry 文字辨識方法、裝置以及儲存其之電腦可讀取紀錄媒體
JP5647919B2 (ja) * 2011-03-07 2015-01-07 株式会社Nttドコモ 文字認識装置、文字認識方法、文字認識システム、および文字認識プログラム
US20150371100A1 (en) * 2014-06-23 2015-12-24 Xerox Corporation Character recognition method and system using digit segmentation and recombination
CN106446896B (zh) * 2015-08-04 2020-02-18 阿里巴巴集团控股有限公司 一种字符分割方法、装置及电子设备
US10552699B2 (en) * 2016-12-27 2020-02-04 Datalogic Usa, Inc. Robust string text detection for industrial optical character recognition

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5998283A (ja) * 1982-11-27 1984-06-06 Hitachi Ltd パターン切出しおよび認識方法、ならびにそのシステム
US4718102A (en) * 1983-01-19 1988-01-05 Communication Intelligence Corporation Process and apparatus involving pattern recognition
FR2604004B1 (fr) * 1986-09-11 1990-05-11 Anatex Procede de reconnaissance d'ecriture manuscrite
JP2719202B2 (ja) * 1989-09-21 1998-02-25 株式会社リコー 線図形特徴抽出及び認識方法
US5029223A (en) * 1990-02-02 1991-07-02 International Business Machines Corporation Constraint driven-on line recognition of handwritten characters and symbols
US5050229A (en) * 1990-06-05 1991-09-17 Eastman Kodak Company Method and apparatus for thinning alphanumeric characters for optical character recognition
US5151950A (en) * 1990-10-31 1992-09-29 Go Corporation Method for recognizing handwritten characters using shape and context analysis
US5313527A (en) * 1991-06-07 1994-05-17 Paragraph International Method and apparatus for recognizing cursive writing from sequential input information

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07273922A (ja) * 1994-03-30 1995-10-20 Matsushita Electric Ind Co Ltd Fax情報転送装置
JP2009259291A (ja) * 2000-11-01 2009-11-05 Fujitsu Ltd 文字認識方法,プログラム及び記録媒体
JP2005182660A (ja) * 2003-12-22 2005-07-07 Matsushita Electric Works Ltd 文字・図形の認識方法
JP4543675B2 (ja) * 2003-12-22 2010-09-15 パナソニック電工株式会社 文字・図形の認識方法
JP2007058304A (ja) * 2005-08-22 2007-03-08 Toshiba Corp 文字認識装置及び文字認識方法
JP2011146028A (ja) * 2010-01-18 2011-07-28 Fujitsu Ltd 文字認識方法及び文字認識装置
JP2012118650A (ja) * 2010-11-30 2012-06-21 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
US9031324B2 (en) 2013-03-19 2015-05-12 Brother Kogyo Kabushiki Kaisha Image-processing device specifying encircling line for identifying sub-region of image
US9558433B2 (en) 2015-06-30 2017-01-31 Brother Kogyo Kabushiki Kaisha Image processing apparatus generating partially erased image data and supplementary data supplementing partially erased image data
JP2018060389A (ja) * 2016-10-06 2018-04-12 アイラボ株式会社 プログラム、情報記憶媒体及び文字分割装置

Also Published As

Publication number Publication date
JP3260843B2 (ja) 2002-02-25
US5497432A (en) 1996-03-05

Similar Documents

Publication Publication Date Title
JPH0676114A (ja) 文字認識方法
Suen et al. Computer recognition of unconstrained handwritten numerals
Wang et al. Optical recognition of handwritten Chinese characters by hierarchical radical matching method
JP6754120B2 (ja) プログラム、情報記憶媒体及び文字分割装置
Lehal et al. Feature extraction and classification for OCR of Gurmukhi script
JPH1196301A (ja) 文字認識装置
Melhi et al. A novel triangulation procedure for thinning hand-written text
Chi et al. Separation of single-and double-touching handwritten numeral strings
Nishida et al. A model-based split-and-merge method for character string recognition
KR0186025B1 (ko) 후보 문자 분류 방법
Ramel et al. A structural representation adapted to handwritten symbol recognition
JP3586949B2 (ja) 帳票認識装置
KR100199296B1 (ko) 규칙적인 잡음을 이용한 한글 인식 시스템
JP2000322514A (ja) パターン抽出装置及び文字切り出し装置
JP3586911B2 (ja) 枠線認識装置
JP3104355B2 (ja) 特徴抽出装置
JPH05120483A (ja) 文字認識装置
Ghorbel et al. A non-interactive hybrid method for structured offline documents.: Application on the mathematical expression
JP4413904B2 (ja) パターン認識装置、パターン認識方法およびパターン認識プログラム
KR19990027482A (ko) 패턴 인식 시스템에서 영상내 물체 구성 직선들의 관계 설정방법
JPH06162266A (ja) オンライン手書き文字認識の方法及びその装置
JP2732748B2 (ja) ファジィパターン認識装置
JP2732753B2 (ja) ファジィパターン認識装置
JPH10207985A (ja) 文字切り出し方法および文字切り出し装置
JPH0696274A (ja) 文字等の認識方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071214

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081214

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081214

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091214

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101214

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101214

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111214

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111214

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121214

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121214

Year of fee payment: 11