JP2727755B2 - 文字列認識方法及びその装置 - Google Patents

文字列認識方法及びその装置

Info

Publication number
JP2727755B2
JP2727755B2 JP2286150A JP28615090A JP2727755B2 JP 2727755 B2 JP2727755 B2 JP 2727755B2 JP 2286150 A JP2286150 A JP 2286150A JP 28615090 A JP28615090 A JP 28615090A JP 2727755 B2 JP2727755 B2 JP 2727755B2
Authority
JP
Japan
Prior art keywords
character
pattern
evaluation value
candidate
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2286150A
Other languages
English (en)
Other versions
JPH04160582A (ja
Inventor
弥生 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP2286150A priority Critical patent/JP2727755B2/ja
Publication of JPH04160582A publication Critical patent/JPH04160582A/ja
Application granted granted Critical
Publication of JP2727755B2 publication Critical patent/JP2727755B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、光学的文字読み取り装置(OCR)等におけ
る文字列認識方法及びその装置に関する。
(従来の技術) 文字列認識は、従来の文字記入枠内に1文字ずつ記入
された文字を対象とする認識方法とは異なり、罫線のよ
うな緩い筆記制約のもとで記入された文字を認識するた
めの技術であり、OCRの帳票形式をより使いやすいもの
にすることを可能にする。文字列認識では、文字記入枠
が無いために文字の切り出しが一つの重要な課題とな
る。特に手書き文字を認識対象にすると、文字の大きさ
や文字間隔等、文字の図形的な特徴の変動が大きいため
に、パタンの図形的な特徴だけからは一文字ずつを切り
出すことは困難である。
従来の文字認識方法としては、文字候補となるパタン
の認識結果を利用して、最適な組み合せを探索する方法
が知られている。例えば、文献1「候補文字ラテイス法
による枠無し筆記文字列のオンライン認識」(村瀬・岩
原・梅田、電子情報通信学会論文誌(D)J68−D、No
4、1985、pp765〜772)に記載されている方法がある。
しかし、この従来の個別文字認識方法では前処理として
大きさの正規化を含むために、パタンの図形的な特徴の
一部が失われ、複数の文字を含むパタンに対しても標準
パタンと高い類似度で認識結果を出力する場合がある等
の問題点があり、認識結果だけでは有効な文字切り出し
は困難である。
このような問題を解決するために、本願と同一出願人
による特願平1−334347「文字列認識方法及びその装
置」に記載の方法が提案されており、前記方法は、文献
2「手書き文字列認識方法の一検討」(佐藤・津雲、電
子通信学会春全大、D−491、1990.3)においても開示
されている。この方法は、文字候補となるパタンの図形
的な特徴量と認識結果から、文字らしさを表す評価値を
算出し、この文字評価値を利用して、文字の切り出しと
認識を同時に行うものである。
(発明が解決しようとする課題) 文献2の方法は、第3図のように文字と文字が接触し
ている場合でも、文字パタンを正しく切り出すために、
文字列画像を細分化し、これらを組み合せて候補文字パ
タンを作成する方法である。しかし、この方法では、候
補文字パタンの中から文字パタンを選択するために、候
補文字パタンの図形的な特徴や認識辞書の標準パタンと
の類似性を評価しているだけであり、候補文字パタンと
隣接するパタンとの境界の情報、即ち結合の強さ等を考
慮していないので、第2図のように文字と文字の境界線
が文字のストロークと複数回交差するような切り出し誤
りを生じる場合がある。
本発明の目的は、このような問題を解決するために、
文字候補となるパタンと隣接するパタンとの境界が文字
の境界であることの信頼性を評価するために接続評価値
を算出し、文字候補となるパタンの文字評価値と接続評
価値とを利用して文字列評価値を算出し、この文字列評
価値を最大にするパタンの組み合せを求めることによ
り、文字列中に接触パタンが含まれていても正しく切り
出すことを可能にすると同時に、一文字パタンの連結領
域が分割されるのを防ぐことを可能にする文字列認識方
法及び装置を提供することにある。
(課題を解決するための手段) 本発明によれば、文字列画像を光学的に読み込み、認
識する方法において、前記文字列画像から図形的特徴を
抽出し、これに基づいて図形的なまとまりの最小単位で
ある基本パタンを抽出し、抽出された基本パタンの少な
くとも1つにもとづいて候補文字パタンを作成し、前記
候補文字パタンと文字認識辞書の標準パタンとを照合し
て認識処理を行い、その認識結果と縦横比及び内部の余
白の長さから文字評価値を算出し、前記候補文字パタン
とこれに隣接する候補文字パタンとの結合の強さを表す
接続評価値を算出し、前記文字評価値と前記接続評価値
を用いて前記候補文字パタンの組み合せに対する文字列
評価値を算出し、前記文字列評価値の最大となる前記候
補文字パタンの組み合せを探索し、前記候補文字パタン
の組み合せに対する文字認識結果の列を前記文字列画像
の認識結果とすることを特徴とする文字列認識方法が実
現できる。
更に、文字列画像を光学的に読み込み、認識する装置
において、光学的に走査された前記文字画像を格納する
文字列画像記憶手段と、前記文字列画像記憶手段からの
文字列画像を読み込み、図形的なまとまりの最小単位で
ある基本パタンを抽出し、これを格納する基本パタン抽
出手段と、前記基本パタン抽出手段からの基本パタンを
読み込み、抽出された基本パタンの少なくとも1つにも
とづいて候補文字パタンを作成し、これを格納する候補
文字パタン作成手段と、前記候補文字パタンに対して、
文字の標準パタンを格納する文字認識辞書記憶手段と、
前記文字認識辞書記憶手段から標準パタンを読み込み、
この標準パタンと前記候補文字パタンとを照合して認識
処理を行い、認識結果を格納し、この認識結果と縦横比
及び内部の余白の長さから前記候補文字パタンの文字評
価値を算出し、これを格納する文字評価値算出手段と、
前記候補文字パタンとこれに隣接する候補文字パタンと
の結合の強さを表す接続評価値を算出し、これを格納す
る接続評価値算出手段と、前記文字評価値算出手段から
前記文字評価値を読み込み、前記接続評価値算出手段か
ら前記接続評価値を読み込み、前記候補文字パタンの組
み合せに対して文字列評価値を算出し、この文字列評価
値が最大になる組み合せを探索し、これを記憶する最適
組み合せ探索手段と、前記最適組み合せ探索手段からの
候補文字パタンの最適な組み合せを読み込み、各候補文
字パタンの認識結果を前記文字評価値算出手段から読み
込み、これを出力する文字列認識結果出力手段とを有す
ることを特徴とする文字列認識装置が実現できる。
(作用) 図面を参照して本発明の一つである文字列認識方法の
原理について詳細に説明する。以下の説明では、縦書き
文字列画像を用いて説明するが、横書きの文字列につい
ても同様の原理が適用できる。第4図(a)は手書き文
字列画像の例である。入力された文字列画像に対して、
第4図(b)のように図形としてのまとまりの最小単位
である基本パタンを抽出する。これは、例えば文字列方
向と垂直な方向に走査し、黒画素の個数を計数して得ら
れる投影分布を基に、その極小値を切り出し位置として
文字列画像を分割することにより可能である。これによ
り、たとえ文字と文字が接触していても、これらを分割
することが可能である。抽出された基本パタンの切り出
し位置を切り出し候補位置と呼び、文字列の先頭から
N0、…、Nkと表す(第4図(b))。切り出し候補位置
NiとNjとに挟まれた少なくとも1つ以上の基本パタンを
組み合せたパタンを候補文字パタンと呼び、l(i、
j)と表す。切り出し候補位置{Ni}の中に求める文字
の切り出し位置が含まれていれば、文字パタンは必ずあ
るl(i、j)により表すことができる。切り出し候補
位置Niをノードとし、候補文字パタンl(i、j)をノ
ードNiとNjを結ぶリンクとすると、文字列画像から第4
図(c)のような2端子有向グラフが得られる。この2
端子有向グラフの各リンクに対して、対応する候補文字
パタンl(i、j)の文字であることの信頼性を表す文
字評価値w(i、j)を算出する。但し、文字評価値w
(i、j)は以下の特性を有するものとする。
候補文字パタンl(i、j)より候補文字パタンl
(i′、j′)の方が一文字パタンである可能性が高い
ならば、w(i、j)<w(i′、j′)が成り立つ。
このような特性を有する文字評価値w(i、j)は前
述の文献2で開示されている技術を利用することで実現
できる。この方法によると、候補文字パタンl(i、
j)の文字である可能性が、候補文字パタンの縦横比及
び内部の余白と認識結果を基に、0から1までの数値で
表現されることになる。しかしながら、この評価値は注
目するパタンだけに対する評価であり、隣接するパタン
との接続関係に対する評価が含まれていない。従って、
この文字評価値から最適な切り出し位置を求めると、第
2図のような切り出し誤りが生ずることがある。本発明
はこの文字評価値の他に、隣接するパタンとの結合の強
さも考慮することにより、最適な切り出し位置を得るも
のである。
例えば第5図(a)と第5図(b)とでは、明らかに
第5図(b)の2つのパタンの方が、第5図(a)の2
つのパタンより分離し易い。逆に言うと、第5図(a)
の切り出し位置に対する2つのパタンの結合度は、第5
図(b)よりも大きい。そこで、各切り出し候補位置Ni
に対して、これを挟んで隣合う2つのパタンの結合の強
さとして以下の特性を持つ評価関数v(i)を設定し、
これを接続評価値と呼ぶ。
切り出し候補位置Niを挟む2つの候補文字パタンの結
合度が、切り出し候補位置Njを挟む2つの候補文字パタ
ンの結合度より大きいならば、 v(i)<v(j)が成り立つ。
図を参照して説明すると、第5図(a)の切り出し位置
Niに対する接続評価値v(i)と第5図(b)の切り出
し位置Njに対する接続評価値v(j)では、v(i)<
v(j)が成り立つ。このような特性を有する評価関数
vは、例えば式(1)により実現できる。
v(i)=exp(−k1c(1)) (1) 但し、k1は正の実数値であり、c(i)は切り出し候
補線とストロークとの交差数である。この評価関数vを
用いて、各切り出し候補位置Niの接続評価値を算出す
る。
以上により、文字列画像から切り出し候補位置Niとそ
の接続評価値v(i)、候補文字パタンl(i、j)と
その文字評価値w(i、j)が得られたことになる。文
字列画像からの文字の切り出しとは、切り出し候補位置
Niの中から、比較的結合度の弱いものNs(i)で、しかも
隣接する切り出し候補位置Ns(i)とNs(i+1)に挟まれたパ
タンl(s(i)、s(i+1))が文字らしい特性を
持つものを抽出することである。2端子有向グラフの始
点N0から終点Nkに至るn個のリンクを通る経路をp=
{Ns(0)、…、Ns(n)}と表すと、2端子有向グラフの経
路と文字列画像からの文字の切り出し位置が対応する。
各経路pに対して接続評価値と文字評価値を用いて、式
(2)より文字列評価値φ(p)を求めて切り出し位置
pの信頼性を評価する。
但し、式(2)は本質的ではなく、接続評価値と文字
評価値から定義される関数で、切り出し位置の信頼性を
評価できるものであれば、本発明には支障なく適用でき
る。
前述の特性〜より、その文字列評価値が最大とな
る経路pを算出することにより、文字の切り出し位置が
求められる。
(実施例) 第1図は本発明の一実施例の構成を示すブロック図で
ある。文字列画像記憶手段1は、2値化された文字列画
像を格納する通常の記憶手段である。基本パタン抽出手
段2は、該文字列画像記憶手段1から文字列画像を信号
9として読み込み、図形としてのまとまりの最小単位の
パタンを抽出し、その切り出し位置を通常の記憶装置に
格納する手段である。例えばこれは、次のようにして実
現できる。文字列画像に対して、その文字列方向と垂直
な方向に黒画素を計数して得られる投影関数をf(x)
とする(第6図(a))。関数f(x)に対して式
(3)で表されるガウシアンg(x)を用いて、式
(4)の計算を施し、平滑化した投影関数F(x)を算
出する(第6図(b))。
該投影関数F(x)の極小値を与える全てのx座標を
算出し、この点及び文字列の先頭位置及び末尾位置を切
り出し候補位置N1とし、この点に通り文字列方向と垂直
な方向の直線を切り出し候補線とする。隣合う切り出し
候補線に挟まれたパタンを基本パタンとする。このよう
にして基本パタンを抽出することは従来技術により容易
に実現できる。候補文字パタン作成手段3では、信号10
として該基本パタンを読み込み、基本パタンそれ自身か
あるいは1つ以上の隣接する基本パタンを組み合せたパ
タンから、1文字である可能性のあるパタンを候補文字
パタンとして通常の記憶手段により記憶する。ここで、
1文字である可能性のあるパタンとは、例えば次のよう
な判定基準により判定するもので、従来技術により容易
に実現できる。
パタンの外接矩形の縦横比(w/h)が0.5≦r≦2.5な
らばそのパタンは候補文字パタンとする(第7図)。
パタンの内部の余白(i)の文字幅(w)に対する比
が0.5以下ならば、候補文字パタンとする(第7図)。
文字評価値算出手段5では、該候補文字パタン作成手
段3から信号11として候補文字パタンを読み込み、文字
認識辞書記憶手段4から信号12として文字の標準パタン
を読み込み、候補文字パタンを認識処理し、候補文字パ
タンの縦横比、内部の余白と認識結果を基に文字評価値
を算出し、文字評価値及び認識結果を記憶する。文字評
価値は、前述の文献2で開示されている技術を利用する
ことにより算出可能である。更に認識処理も、例えば従
来より良く知られている技術である単純類似度法を用い
ることにより容易に実現できる(文献「文字認識概論」
オーム社、1982、pp34−35参照)。接続評価値算出手段
6は、基本パタン抽出手段2より信号13として切り出し
候補位置を読み込み、式(1)で表される接続評価関数
v(i)を用いて、各切り出し候補位置Niの接続評価値
を算出し、これを通常の記憶手段により記憶する。式
(1)の中に用いられている交差数c(i)は切り出し
線に沿って文字列画像を走査し、白画素から黒画素に変
化する画素数を計数することにより算出可能である。最
適組み合せ探索手段7では、接続評価値算出手段6より
信号14として、各切り出し候補位置の接続評価値を読み
込み、文字評価値算出手段5から信号15として、各候補
文字パタンの文字評価値を読み込み、切り出し候補位置
Niをノードとし、候補文字パタンl(i、j)をリンク
とする2端子有向グラフに於いて、始点N0から終点Nk
至る、n込のリンクを通るパスp={Ns(0)、…、
Ns(n)}に対して式(2)で表される文字列評価値φ
(p)を算出し、この文字列評価値を最大にするパスを
探索する。この最適パスは動的計画法(文献「音声認
識」共立出版、1979、pp107−108参照)を用いて効率的
に探索することが可能であり、容易に実現できる。文字
列認識結果出力手段8では、前記最適組み合せ探索手段
7から信号16として最適パスp={Ns(0)、…、Ns(n)
を読み込み、そこに含まれる各候補文字パタンl(s
(1)、s(i+1))を前記文字列画像の文字パタン
として、前記文字評価値算出手段5から対応する認識結
果を信号17として読み込み、文字列画像の先頭に位置す
る候補文字パタンから認識結果を出力するもので、容易
に実現できる。
以上、実施例をもって本発明を詳細に説明したが、本
発明はこの実施例にのみ限定されるものではない。例え
ば、候補文字パタン作成手段は、この後に続く処理量を
削減するためのものであり、前述のような判定基準を用
いずに、あらゆる基本パタンの組合せを候補文字パタン
として処理を行うことも可能である。更に、接続評価値
算出手段においてはその評価値の算出方法は一例であ
り、前述の特性を満たす関数ならば、本発明には適用
できる。
(発明の効果) 以上のように本発明によれば、文字列中に接触パタン
が含まれていても正しく文字の切り出しを行うことを可
能にすると同時に、第2図で示される文字の連結領域が
分割されるような切り出し誤りを防ぐことが可能にな
る。
【図面の簡単な説明】
第1図は本発明の1つである文字列認識装置の一実施例
の構成を示すブロック図、第2図、及び第3図は発明が
解決しようとする課題を説明するための図、第4図
(a)〜(c)は本発明の原理を説明するための図、第
5図(a)、(b)、第6図(a)、(b)、及び第7
図は本発明の実施例を説明するための図である。図中、
1は文字列画像記憶手段、2は基本パタン抽出手段、3
は候補文字パタン作成手段、4は文字認識辞書記憶手
段、5は文字評価値算出手段、6は接続評価値算出手
段、7は最適組み合せ探索手段、8は文字列認識結果出
力手段である。

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】文字列画像を光学的に読み込み、認識する
    方法において、前記文字列画像から図形的特徴を抽出
    し、これに基づいて図形的なまとまりの最小単位である
    基本パタンを抽出し、抽出された基本パタンの少なくと
    も1つにもとづいて候補文字パタンを作成し、前記候補
    文字パタンと文字認識辞書の標準パタンとを照合して認
    識処理を行い、その認識結果と縦横比及び内部の余白の
    長さから文字評価値を算出し、前記候補文字パタンとこ
    れに隣接する候補文字パタンとの結合の強さを表す接続
    評価値を算出し、前記文字評価値と前記接続評価値を用
    いて前記候補文字パタンの組み合せに対する文字列評価
    値を算出し、前記文字列評価値の最大となる前記候補文
    字パタンの組み合せを探索し、前記候補文字パタンの組
    み合せに対する文字認識結果の列を前記文字列画像の認
    識結果とすることを特徴とする文字列認識方法。
  2. 【請求項2】文字列画像を光学的に読み込み、認識する
    装置において、光学的に走査された前記文字列画像を格
    納する文字列画像記憶手段と、前記文字列画像記憶手段
    からの文字列画像を読み込み、図形的なまとまりの最小
    単位である基本パタンを抽出し、これを格納する基本パ
    タン抽出手段と、前記基本パタン抽出手段からの基本パ
    タンを読み込み、抽出された基本パタンの少なくとも1
    つにもとづいて候補文字パタンを作成し、これを格納す
    る候補文字パタン作成手段と、前記候補文字パタンに対
    して、文字の標準パタンを格納する文字認識辞書記憶手
    段と、前記文字認識辞書記憶手段からの標準パタンを読
    み込み、この標準パタンと前記候補文字パタンとを照合
    して認識処理を行い、認識結果を格納し、この認識結果
    と縦横比及び内部の余白の長さから前記候補文字パタン
    の文字評価値を算出し、これを格納する文字評価値算出
    手段と、前記候補文字パタンとこれに隣接する候補文字
    パタンとの結合の強さを表す接続評価値を算出し、これ
    を格納する接続評価値算出手段と、前記文字評価値算出
    手段から前記文字評価値を読み込み、前記接続評価値算
    出手段から前記接続評価値を読み込み、前記候補文字パ
    タンの組み合せに対して文字列評価値を算出し、この文
    字列評価値が最大になる組み合せを探索し、これを記憶
    する最適組み合せ探索手段と、前記最適組み合せ探索手
    段からの候補文字パタンの最適な組み合せを読み込み、
    各候補文字パタンの認識結果を前記文字評価値算出手段
    から読み込み、これを出力する文字列認識結果出力手段
    とを有することを特徴とする文字列認識装置。
JP2286150A 1990-10-24 1990-10-24 文字列認識方法及びその装置 Expired - Fee Related JP2727755B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2286150A JP2727755B2 (ja) 1990-10-24 1990-10-24 文字列認識方法及びその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2286150A JP2727755B2 (ja) 1990-10-24 1990-10-24 文字列認識方法及びその装置

Publications (2)

Publication Number Publication Date
JPH04160582A JPH04160582A (ja) 1992-06-03
JP2727755B2 true JP2727755B2 (ja) 1998-03-18

Family

ID=17700588

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2286150A Expired - Fee Related JP2727755B2 (ja) 1990-10-24 1990-10-24 文字列認識方法及びその装置

Country Status (1)

Country Link
JP (1) JP2727755B2 (ja)

Also Published As

Publication number Publication date
JPH04160582A (ja) 1992-06-03

Similar Documents

Publication Publication Date Title
JP3343864B2 (ja) 語体の分離方法
JP3842006B2 (ja) 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US5067165A (en) Character recognition method
US5410611A (en) Method for identifying word bounding boxes in text
US5390259A (en) Methods and apparatus for selecting semantically significant images in a document image without decoding image content
KR100412317B1 (ko) 문자인식/수정방법및장치
US6681044B1 (en) Retrieval of cursive Chinese handwritten annotations based on radical model
JPH0772905B2 (ja) 記号列の認識方法
Zeki The segmentation problem in arabic character recognition the state of the art
Rothacker et al. Word hypotheses for segmentation-free word spotting in historic document images
JP2727755B2 (ja) 文字列認識方法及びその装置
KR100449486B1 (ko) 수직선 인접 그래프를 이용한 문서 인식 시스템 및 방법
JPS6316795B2 (ja)
JP2671533B2 (ja) 文字列認識方法及びその装置
JP2000322514A (ja) パターン抽出装置及び文字切り出し装置
JP2903779B2 (ja) 文字列認識方法及びその装置
JP3209197B2 (ja) 文字認識装置及び文字認識プログラムを記録した記録媒体
JPH04299485A (ja) 文字列認識方法及びその装置
JP3344062B2 (ja) カタカナ手書き文字切り出し回路
JP3419251B2 (ja) 文字認識装置及び文字認識方法
JP3345246B2 (ja) 文字認識装置及び文字認識方法
Graf et al. Analysis of complex and noisy check images
JPH06162266A (ja) オンライン手書き文字認識の方法及びその装置
JPH04130979A (ja) 文字画像切出し方法
JP2832035B2 (ja) 文字認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees