JP2000353215A - 文字認識装置および文字認識プログラムを記録した記録媒体 - Google Patents

文字認識装置および文字認識プログラムを記録した記録媒体

Info

Publication number
JP2000353215A
JP2000353215A JP11165358A JP16535899A JP2000353215A JP 2000353215 A JP2000353215 A JP 2000353215A JP 11165358 A JP11165358 A JP 11165358A JP 16535899 A JP16535899 A JP 16535899A JP 2000353215 A JP2000353215 A JP 2000353215A
Authority
JP
Japan
Prior art keywords
character
recognition
characters
word
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11165358A
Other languages
English (en)
Inventor
Daisuke Nishiwaki
大輔 西脇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP11165358A priority Critical patent/JP2000353215A/ja
Priority to US09/590,261 priority patent/US6738519B1/en
Publication of JP2000353215A publication Critical patent/JP2000353215A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/226Character recognition characterised by the type of writing of cursive writing
    • G06V30/2268Character recognition characterised by the type of writing of cursive writing using stroke segmentation
    • G06V30/2272Character recognition characterised by the type of writing of cursive writing using stroke segmentation with lexical matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • G06V30/268Lexical context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 単語照合により読み飛ばした部分が、2文字
以上の場合においても、文字切り出しの不安定性に依存
しない再認識の手段を新たに実現する。 【解決手段】 読み飛ばした部分、つまり単語照合時に
不一致となった部分のイメージに対し、1文字分の文字
候補を切り出さずに、不一致部分をまとめて認識するn
文字認識部とn文字認識部が認識の際に参照するn文字
認識辞書を新たに備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力されたイメー
ジデータから文字列を自動的に読み取る文字認識装置に
利用する。具体的には、郵便物や帳票に記入された住
所、氏名もしくは製品番号等を読み取る装置や、スタイ
ラスペンを用いて文字列を入力するペン入力装置に関す
る。
【0002】
【従来の技術】従来の文字認識装置を図9および図10
を参照して説明する。図9は従来の文字認識装置の要部
ブロック構成図である。図10は従来技術における文字
認識を説明するための図である。ここでは、特に複数の
文字より構成される文字列、すなわち単語を読み取り対
象とする文字認識装置に関する従来の技術を述べる。
【0003】図9に示すように、住所または氏名等の単
語や製品コードのように、複数の文字から構成される文
字列を1文字毎に切り出す文字切り出し手段である文字
切り出し部301と、1文字毎に文字を認識する文字認
識手段である1文字認識部401とを用いて読み取る場
合には、文字切り出し部301において、1文字毎に切
り出した文字パタン全てが、1文字認識部401におい
て正確に認識される可能性は低い。そこで、認識対象の
単語を格納する単語データ格納手段である単語辞書60
2を備えることにより、文字列中のいくつかの文字が1
文字認識部401において正しく認識できなくても、単
語辞書602から最も認識結果との一致数の高いものを
単語照合部601において検索することにより、単語単
位の認識性能を向上させることができる。このような構
成の文字認識装置の例は、特開平2−109187号公
報「べた書き住所の後処理方式」(=引用文献1とす
る)、特開平5−114053号公報「文字認識後処理
方式」(=引用文献2とする)により開示されている。
【0004】しかしながら、これら引用文献1、引用文
献2で示されるような照合をベースとする方式は、認識
対象の文字列中の文字間接触の増加、もしくは認識対象
となる単語数の増加に伴い、照合時に誤った訂正が発生
してしまう。これは、文字切り出し部301が切り出す
べき文字数をあらかじめ仮定していないためで、特に、
文字間接触を文字列中に多く含む場合には、切り出し結
果として得られる文字候補パタンに対する認識結果か
ら、認識対象単語としての候補が多数得られ、正解を絞
り切れなくなるためである。
【0005】これに対し、例えば「F.Kimura etal:”A
Lexicon Directed Algorithm for Recognition of Unco
nstrained Handwritten Words”,IEICE Trans. INF.& S
YST.,Vol.E77-D,No.7(1994.7).」(=引用文献3とす
る)のように、認識対象単語中の各単語をあらかじめ仮
定し単語毎に、その文字数分の文字切り出しを行うこと
によって文字候補パタンを生成し、それらに対して個別
文字認識を行った結果、どれくらいあらかじめ仮定して
いる単語に近い認識結果を出力するかを、各文字候補パ
タンに対する個別文字認識の信頼度の和もしくは積で表
現される単語の確信度の大小を用いて認識する方式があ
る。しかしながら、この方法でも、読み取り対象となる
単語中に1文字だけ異なるような類似の2個の単語が存
在するような場合には、その両者の区別ができなくなる
という欠点がある。これは、文字列全体に対する評価値
で判定するため、文字列中に確信度の低い認識結果が出
現してもうまく反映されないからである。
【0006】引用文献1から引用文献3の一連の単語認
識方式は、いずれも文字切り出しによって得られた文字
候補パタンのうち、確実に認識できた部分を使って、認
識できない部分、もしくは確信度の低い部分は単語情報
の併用により補っている。この際、認識できなかった部
分や確信度の低い部分、つまり読み飛ばしてしまった部
分については、本当に単語照合により補われた文字でよ
いのかを検証していないため、前述のような類似単語の
誤認識が起こる。
【0007】一方、上記読み飛ばしによる誤認識を防ぐ
ために、例えば、特許第2734386号「文字列認識
装置」(=引用文献4とする )のように、前述の読み
飛ばした部分の文字候補を最初に用いた文字認識方式と
は別の方式で再度認識させている。これにより、単語を
構成する全ての文字について文字認識結果がそろうた
め、曖昧な部分がなくなり、誤読が低減できる。しかし
ながら、この方式においては、読み飛ばした部分の検証
は、個別文字認識で行っているため、1文字毎に切り出
されていることが必須であり、例えば、2文字の接触が
発生している部分に上述の再認識を行おうとした場合に
は、その部分が2個の文字候補に正しく切り出されてい
ることが必要であり、そうでない場合、つまり2文字分
のイメージが正しく2分割されていない場合には誤認識
が発生する。
【0008】
【発明が解決しようとする課題】このように、引用文献
1から引用文献4で説明した従来例は、単語情報を併用
する際に曖昧になった部分、つまり飛び越した部分が2
文字以上の接触で、それが正しく切り出されていないと
検証としての再認識ができず、単語照合であくまでも一
番似ている単語に認識してしまう。その結果、たまたま
読み飛ばした部分だけが異なる別の単語が存在するよう
な場合には、誤認識が発生することが問題である。同様
な問題は、引用文献1から引用文献4で説明した従来例
以外にも、特開平3−48379号公報、特開平3−1
54985号公報、特開平5−290217号公報、特
開平7−192094号公報、特許第2619499号
公報に開示された文字認識技術にもみられる。
【0009】図10にその具体例を示す。同図は、”H
undred”が正解であるが、単語照合を行う前の文
字切り出し手段と文字認識手段だけを用いた場合の認識
結果は、”Th????d”となる。この結果から単語
照合を行うと、例えば、認識対象が数字の単語である場
合、”Thousand”が最も近い単語として選択さ
れてしまい結果的に誤読する。これに対して前述の引用
文献4では、更に、照合により読み飛ばした部分”ou
san”に相当する部分パタンを別の個別文字認識で検
証するが、この例のように文字切り出しが正確でない場
合には、読み飛ばし部分を正しく認識することができな
い。
【0010】本発明は、このような背景に行われたもの
であって、単語照合により読み飛ばした部分が、2文字
以上の場合においても、文字切り出しの不安定性に依存
しない再認識の手段を新たに実現することにより、曖昧
性の無い、認識精度の高い単語認識を実現することがで
きる文字認識装置および文字認識プログラムを記録した
記録媒体を提供することを目的とする。本発明は、処理
速度を高速化することができる文字認識装置および文字
認識プログラムを記録した記録媒体を提供することを目
的とする。
【0011】
【課題を解決するための手段】単語照合により読み飛ば
した部分が、2文字以上の場合においても、文字切り出
しの不安定性に依存しない検証を実現するために、本発
明の文字認識装置は、読み飛ばした部分、つまり単語照
合時に不一致となった部分のイメージに対し、1文字分
の文字候補を切り出さずに、不一致部分をまとめて認識
するn文字認識部とn文字認識部が認識の際に参照する
n文字認識辞書を新たに備えて構成される。
【0012】すなわち、本発明の第一の観点は文字認識
装置であって、本発明の特徴とするところは、文字列画
像を入力し記憶するイメージ格納手段と、前記イメージ
格納手段に入力された文字列画像に対し1文字毎の文字
候補パタンを作成するとともに文字同士が接触している
部分を検出し接触する文字数を推定する文字切り出し手
段と、前記文字切り出し手段により作成された1文字毎
の文字候補に対しその文字種を判定するとともにその確
信度を出力する1文字認識手段と、前記1文字認識手段
が判定に用いる1文字認識辞書と、前記文字切り出し手
段により検出された文字同士が接触している部分が前記
文字切り出し手段によりn文字と推定された場合にこの
n文字分の文字種を判定するn文字認識手段と、前記n
文字認識手段が判定に用いるn文字認識辞書と、前記イ
メージ格納手段、前記文字切り出し手段、前記1文字認
識手段、前記n文字認識手段を制御する制御手段とを備
えたところにある。
【0013】さらに、前記1文字認識手段により得た1
文字認識結果および前記n文字認識手段により得たn文
字認識結果にしたがって登録されている候補単語に対し
文字の一致数の大きい順に照合した単語を出力する単語
照合手段と、この単語照合手段が照合時に用いる単語辞
書とを備える構成とすることもできる。
【0014】前記制御手段は、前記文字切り出し手段に
より得た1文字毎の文字候補パタンに対し前記1文字認
識手段が出力した信頼度が低くかつその文字候補パタン
が前記文字切り出し部で検出した文字同士が接触してい
る部分から得たものであった場合にはその文字候補パタ
ンを含む文字同士が接触している部分に対しn文字認識
を行いその認識結果を採用する手段を含む構成とするこ
とが望ましい。
【0015】また、前記制御手段は、前記文字切り出し
手段により得た1文字毎の文字候補パタンに対し前記1
文字認識手段が出力した認識結果に対する前記単語照合
手段から得た照合結果に対し完全に一致するものがあれ
ば文字列イメージに対する1文字毎の認識結果の全てに
対する確信度を調べいずれもある値以上であれば前記1
文字認識手段が出力した認識結果を採用しそうでなけれ
ば入力した文字列イメージに対する認識を中止する手段
と、前記文字切り出し手段で得た1文字毎の文字候補パ
タンの前記1文字認識手段の認識結果に対する前記単語
照合手段の照合結果に対し完全に一致するものがない場
合には1文字認識結果の異なる部分に相当する文字列イ
メージを照合を試みた単語の一致文字数の大きいものか
ら順に単語照合で不一致となった部分の文字数と文字種
とともに前記n文字認識手段に送り込む手段と、この送
り込む手段により送り込まれた文字列イメージに対し前
記n文字認識手段では当該文字列イメージの再認識を行
いその認識結果およびその確信度を出力しその確信度が
ある値以上であれば照合中の単語を入力文字列に対する
認識結果の最終候補として残し前記1文字認識手段が起
動した部分については前記1文字認識手段が出力した確
信度および前記n文字認識手段が起動した部分について
は前記n文字認識手段が出力した確信度をそれぞれ用い
て照合中の文字列全体に対する評価値を計算し照合単語
のうち前記最終候補として残った単語の中で一番評価値
の高いものを入力文字列に対する認識結果とする手段と
を含む構成とすることもできる。
【0016】さらに、前記文字切り出し手段は、文字同
士が接触している部分から1文字毎の文字候補パタンを
作成するときに接触している文字の境界を文字同士が接
触している部分の黒画素に対し文字列方向と垂直方向に
当該黒画素をトレースした際の隣接するランのラン長の
変化を用いて検出する手段を含む構成とすることが望ま
しい。
【0017】あるいは、前記文字切り出し手段は、文字
同士が接触している部分から1文字毎の文字候補パタン
を作成するときに接触している文字の境界を文字同士が
接触している部分の文字ストロークに対する文字列方向
と垂直な方向に対する極大点ならびに極小点を用いて検
出する手段を含む構成とすることが望ましい。
【0018】また、前記n文字認識手段は、文字同士が
接触する部分を1文字毎の文字候補パタンに分割せず全
体で認識を行い認識結果の確信度を出力しその全体認識
ための認識辞書をn文字認識辞書に格納する手段を含む
構成とすることが望ましい。
【0019】あるいは、前記n文字認識手段は、文字同
士が接触する部分を1文字毎の文字候補パタンに分割せ
ず全体で認識を行うときに文字列を囲む矩形を仮定しそ
の矩形の高さに相当する高さおよび1文字分の文字幅以
下の高さを持つ領域を設定しその領域を前記矩形の一方
から他方に移動させていくことにより得られた移動毎に
得られる領域内の特徴の変化を用いて認識を行うととも
に認識結果の確信度を出力しそのための認識辞書をn文
字認識辞書に格納する手段を含む構成とすることが望ま
しい。
【0020】これにより、単語照合により読み飛ばした
部分が、2文字以上の場合においても、文字切り出しの
不安定性に依存しない再認識の手段を新たに実現するこ
とにより、曖昧性の無い、認識精度の高い単語認識を実
現することができるとともに、処理速度の高速化を図る
ことができる。
【0021】すなわち、本発明の第一の効果として、文
字接触を有する文字列の認識性能の格段の向上が図れ
る。その理由は、単語照合で不一致であった部分に対し
て、本発明の特徴であるn文字認識部を使った認識を行
うことで、その部分が接触文字であっても正確な認識が
行え、曖昧性が完全に解消されるからである。その結
果、従来の技術でも述べた、誤った文字切り出しによっ
て得られた文字候補パタンを誤認識することによる文字
列の誤読を飛躍的に抑制できる。
【0022】次に、本発明の第二の効果として、処理速
度の高速化が図れる。本発明における文字認識装置は、
n文字認識をその特徴として有するが、文字列全体をn
文字認識のみで認識するのは、文字列を文字切り出しに
より1文字毎の文字候補パタンに分割してから、1文字
毎に文字認識を行う方法に比べて処理時間が非常に多く
かかる。本発明における文字認識装置では、文字切り出
しを行い、1文字認識で信頼度の低い認識結果が得られ
た場合(第一実施例)や、単語照合の結果曖昧な部分が
あった場合(第二実施例)にだけ、それらに相当する部
分に対してのみ、n文字認識が動くことから、n文字認
識を入力文字列全体に対して適用する場合に比べて格段
に処理量が減る。その結果、文字切り出しを行って認識
する方式と、文字列全体をまとめて認識する方式を入力
文字列に対して独立に行い、両者の認識結果をその後で
統合して最終認識結果を決定する方式と比較した場合
に、たとえ両者を並列に処理したとしても後者の文字列
全体をまとめて認識する方式が時間的にネックになるの
に対し、本発明の文字認識装置は、必要最低限の文字数
に絞って、また単語認識の場合には文字種も絞ってから
n文字認識を実行するので、きわめて高速に認識結果を
得ることが可能である。
【0023】本発明の第二の観点は機械読み取り可能な
記録媒体であって、本発明の特徴とするところは、文字
列画像を入力し記憶するステップと、記憶した文字列画
像から1文字毎の文字候補パタンを作成するとともに文
字同士が接触している部分を検出し接触する文字数を推
定するステップと、作成された1文字毎の文字候補に対
しその文字種を判定するとともにその確信度を出力する
ステップと、その確信度がある値以下でかつ文字同士が
接触している部分に含まれている際にこの文字同士が接
触している部分に対しn文字分の文字種を判定し確信度
を出力するステップと、1文字の認識結果とn文字認識
結果のそれぞれの確信度がある値以上の場合にそれを入
力文字列に対する認識結果として出力するステップとを
備えることを特徴とするコンピュータ上で動作する文字
列認識プログラムを記録したところにある。
【0024】あるいは、文字列画像を入力し記憶するス
テップと、記憶した文字列画像から1文字毎の文字候補
パタンを作成するとともに文字同士が接触している部分
を検出し接触する文字数を推定するステップと、作成さ
れた1文字毎の文字候補に対しその文字種を判定すると
ともにその確信度を出力するステップと、登録されてい
る候補単語に対し文字の一致数の大きい順に照合した単
語を出力するとともにそれぞれの照合単語に対し不一致
部分を出力する単語照合ステップと、この単語照合ステ
ップにより得たそれぞれの照合単語に対する不一致部分
に相当する画像を入力画像から獲得しその文字数と文字
種を仮定した複数文字分の文字種を判定するとともにそ
の確信度を出力するn文字認識ステップと、1文字の認
識結果とn文字認識結果のそれぞれの確信度がある値以
上の場合にそれを入力文字列に対する認識結果として出
力するステップとを備えることを特徴とするコンピュー
タ上で動作する文字列認識プログラムを記録したところ
にある。
【0025】
【発明の実施の形態】(第一実施例)本発明第一実施例
の文字認識装置の構成を図1を参照して詳細に説明す
る。図1は本発明第一実施例の文字認識装置の要部ブロ
ック構成図である。本発明第一実施例の文字認識装置
は、図1に示すように、文字列画像を入力し記憶するイ
メージ格納部101と、イメージ格納部101に入力さ
れた文字列画像に対し1文字毎の文字候補パタンを作成
するとともに文字同士が接触している部分を検出し接触
する文字数を推定する文字切り出し部301と、文字切
り出し部301で作成された1文字毎の文字候補に対し
その文字種を判定するとともにその確信度を出力する1
文字認識部401と、1文字認識部401が判定に用い
る1文字認識辞書402と、文字切り出し部301で検
出した文字同士が接触している部分が文字切り出し部3
01でn文字と推定した場合にn文字分の文字種を判定
するn文字認識部501と、n文字認識部501が判定
に用いるn文字認識辞書502と、1文字認識部401
で得た1文字認識結果とn文字認識部501で得たn文
字認識結果とを用いて登録されている候補単語に対し文
字の一致数の大きい順に照合した単語を出力する単語照
合部601と、単語照合部601が照合時に用いる単語
辞書602、ならびに、イメージ格納部101、文字切
り出し部301、1文字認識部401、n文字認識部5
01を制御する制御部201とを備えることを特徴とす
る。
【0026】次に、本発明実施例の文字認識装置の動作
を図2を参照して説明する。図2は本発明第一実施例の
動作を示すフローチャートである。以下に説明する一連
の動作は、図1に示す制御部201が行う。制御部20
1は、イメージ格納部101、文字切り出し部301、
1文字認識部401、n文字認識部501、単語照合部
601の動作を制御するもので、各部とのデータバス7
01を介したデータの送受、各部への制御信号の発行が
可能であればよく、例えばコンピュータ上で実現が可能
である。
【0027】認識対象となる文字列画像は、スキャナも
しくはスタイラスペン等の光電変換手段によって電気信
号に変換され、データバス701を通じて、イメージ格
納部101に蓄積される(ステップ11)。イメージ格
納部101は、コンピュータ機器に使われている一般的
なメモリデバイスで実現できる。また、入力画像は、例
えば、図3に示すような複数の文字から構成される画像
である。
【0028】次に、文字切り出し部301で、イメージ
格納部101に格納されている文字列画像に対して文字
切り出しを行い、文字列画像から1文字毎の文字領域を
検出する(ステップ21)。この文字切り出しは、例え
ば「西脇、山田:黒色罫線枠帳票における接触数字切り
出し、電子情報通信学会情報・システムソサイエティ大
会、D-12-3(1997).」を用いることでコンピュータ上で
実現可能である。例えば図3の文字列では、文字の接触
部分に対して縦方向の白ランで文字の切断候補が検出で
きる。また、他の文字と接触していない文字について
は、黒画素の水平軸への投影プロファイルである幅以下
のものを検出することで実現できる。接触文字に対して
検出された文字境界を任意に2個選択し、それらに挟ま
れる部分を文字候補パタンとする。例えば図3の「22
0」という3文字の接触パタンに対し、得られた切断候
補の左から2番目、5番目を選択すると、図4のような
文字候補パタンが生成される。1個の文字列パタンに対
する文字候補は、場合によっては複数通りの組み合わせ
が生成可能であるが、例えば図3では、これを括弧で表
現しており、3通りの文字切り出しが存在する。
【0029】次に、ステップ21で生成された各々の文
字候補パタンに対して、1文字認識部401で文字認識
を行う(ステップ31)。この1文字認識は、例えば
「Tsukumo etal;Handprinted Kanji Character Recogni
tion based on Flexible Template Maching,Proc of 11
th Intl. Conf. Pattern Recognition,pp.483-486 (199
2).」を用いてコンピュータ上で実現できる。文字認識
結果に対する信頼度は、例えば、第1位の認識結果に対
する距離値と第2位の認識結果に対する距離値との比を
とればよく、1文字認識辞書402には、学習用の文字
パタンから抽出した照合用の特徴を格納する。1文字認
識辞書402は、1文字認識部401からアクセス可能
なメモリにセットすればよい。
【0030】次に、文字切り出し時に文字列中の文字同
士が接触していたかしていなかったかどうかを判定する
(ステップ41)。もし文字間の接触がなく、文字列を
構成する全ての文字が孤立パタンで構成されている場合
には、文字列の評価値E1を計算する(ステップ5
1)。文字列の評価値E1は、孤立文字パタンの1文字
認識の認識結果に対する信頼度から計算すればよく、全
ての1文字認識結果の信頼度の積または和で表現すれば
よい。
【0031】この文字列評価値E1があらかじめ設定し
ている値SH1よりも大きいかどうかを判定する(ステ
ップ61)。もし、大きければ、ステップ31で得られ
た孤立文字パタンに対する1文字認識結果を、入力文字
列に対する認識結果として採用する(ステップ71)。
逆に、文字列評価値が、あらかじめ設定している値より
も小さい場合には、入力文字列に対する認識結果は棄却
する。この際、各々の孤立文字パタンに対する1文字認
識結果の信頼度を個別に吟味し、信頼度の高い認識結果
だけを出力することも可能である。なお、上記SH1
は、学習用の文字列から、誤認識が生じない範囲を調査
することにより設定可能である。また、各々の孤立文字
パタンに対する1文字認識結果を採用するに十分な信頼
度の大きさも、例えば、1文字認識部301の学習に用
いたパタンのうち、誤読したパタンに対する信頼度の上
限値を調査することにより設定可能である。
【0032】一方、前記ステップ41にて、文字切り出
し時に文字列中の文字同士が接触していた場合には、文
字列中から文字の互いに接触している部分を接触ブロッ
クBi(i<文字数)を取り出し、接触ブロックBiに
対する確信度Ciを計算する(ステップ91)。Ci
は、接触ブロックを構成する文字候補パタンに対して、
前記ステップ31で求めた、1文字認識の認識結果に対
する信頼度の積または和で表現すればよい。このとき、
全ての接触ブロックBiに対する確信度Ciが、ある値
SH2以上であれば(ステップ101)、ステップ31
で求めた1文字認識結果を入力文字列に対する認識結果
とする(ステップ71)。この際、図5に示すように、
接触パタンに対する文字候補パタンの組み合わせは複数
存在しうる。図5では、3種類存在し、それぞれの文字
候補パタンに対する認識結果の信頼度は、{e(1,i
+1),e(1,i+2),e(1,i+3)}、{e
(2,i+1),e(2,i+2),e(2,i+
3)}、{e(3,i+1),e(3,i+2),e
(3,i+3)}となる。このような場合、この接触ブ
ロックC1、「220」に対する確信度B1は、{}内
の信頼度の総和もしくは総積の最大のものを用いればよ
い。なお、上記SH2は、学習用の接触ブロックより誤
読が生じない確信度の値をあらかじめ求めておけばよ
い。
【0033】一方、ステップ101で、ある接触ブロッ
クBiに対する確信度Hiが、ある値SH2以下であれ
ば、n文字認識部501へ当該接触ブロックのイメージ
を送る。n文字認識部501では、接触ブロックを1文
字毎の文字候補パタンに分割せず、接触ブロック全体を
一度に認識し、接触ブロック中の文字数分の認識結果と
認識結果に対する確信度Hiを出力する(ステップ11
1)。n文字認識辞書502には、学習用の文字列パタ
ンから抽出した照合用の特徴を格納する。n文字認識辞
書502は、n文字認識部501からアクセス可能なメ
モリにセットすればよい。n文字認識部501は、例え
ば図7に示すように、接触ブロックに対して1文字幅の
数分の1幅程度の特徴抽出窓を使い、その特徴抽出窓を
文字列の一方の端からもう一方の端に移動しながら、特
徴抽出窓内で特徴を抽出していく。特徴は前出の「Tsuk
umo etal;Handprinted Kanji Character Recognition b
ased on Flexible Template Maching,Proc of 11th Int
l. Conf. PatternRecognition,pp.483-486 (1992).」
で用いる方向特徴を用いればよく、この特徴変化をオー
トマトンの状態遷移に当てはめ、状態の遷移状況を用い
て認識する。具体的には「T.M.Ha et al;Off-line Hand
written Numeral String Recognition by Combining Se
gmentation-based and Segmentation-free Methods, Pa
ttern Recognition, Vol.31, No.3 pp.257-272 (1998.
3).」を用いて、コンピュータ上で実現できる。この
他、文字列をその端点、交点を節とするグラフで表現
し、グラフマッチングを行ってもよい。なお、あらかじ
め文字列中の文字数が既知である場合には、n文字認識
に何文字分に相当する接触ブロックであるかを渡して認
識に用いる。また、記の方式で接触ブロックを認識した
場合には、接触ブロック中の文字数分の認識結果と認識
結果に対する確信度Hiは、上記の方式が認識結果と同
時に計算する尤度を用いればよい。
【0034】次に、n文字認識部501(ステップ11
1)で計算した、接触ブロック中の文字数分の認識結果
と認識結果に対する確信度Hiの大きさを調べる(ステ
ップ121)。確信度HiがSH3以上であった場合に
は、その接触ブロックBiに対してn文字認識部の認識
結果を採用し、孤立文字に対する1文字認識部の認識結
果と合わせて出力する(ステップ131)。このとき、
1文字認識部の認識結果に対する信頼度が小さい場合に
は、該当部分だけを棄却とし、n文字認識結果だけ出力
してもよい。1文字認識結果を採用するための信頼度の
下限値は、1文字認識辞書を作成する際に用いた学習用
のパタンを用いて決定できる。
【0035】一方、確信度HiがSH3以下である場合
には、n文字認識部の認識結果を棄却する(ステップ1
41)。したがって、文字列としては文字列を構成する
全ての文字に対し、認識結果がそろわないので棄却とす
る。ただし、このとき、1文字認識部の認識結果に対す
る信頼度が大きい場合には、n文字認識部501で得た
結果だけ棄却し、1文字認識結果が得られている部分だ
けを出力してもよい。なお、上記SH3は、学習用のパ
タンを用い、それらが誤読しないような値に設定すれば
よい。
【0036】(第二実施例)次に、図6を用いて本発明
第二実施例について説明する。以下に説明する一連の動
作は、本発明第一実施例と同様に、制御部201が行
う。制御部201は、イメージ格納部101、文字切り
出し部301、1文字認識部401、n文字認識部50
1、単語照合部601の動作を制御するもので、各部と
のデータバス701を介したデータの送受、各部への制
御信号の発行が可能であればよく、例えばコンピュータ
上で実現が可能である。
【0037】認識対象となる文字列画像は、スキャナも
しくはスタイラスペン等の光電変換手段によって電気信
号に変換され、データバス701を通じてイメージ格納
部101に蓄積される(ステップ12)。イメージ格納
部101は、コンピュータ機器に使われている一般的な
メモリデバイスで実現できる。また、入力画像は、例え
ば、図3に示したような複数の文字から構成される単語
画像である。以下、図10に例示した「Hundre
d」を用いて動作を説明する。
【0038】次に、文字切り出し部301で、イメージ
格納部101に格納されている文字列画像に対して文字
切り出しを行い、文字列画像から1文字毎の文字領域を
検出する(ステップ22)。この文字切り出しは、本発
明第一実施例と同様に、例えば「西脇、山田:黒色罫線
枠帳票における接触数字切り出し、電子情報通信学会情
報・システムソサイエティ大会、D-12-3(1997).」を用
いることでコンピュータ上で実現可能である。例えば、
図10に例示した文字列「Hundred」では、7個
の文字候補パタンに分割される。
【0039】次に、ステップ22で生成された各々の文
字候補パタンに対し、1文字認識部401で文字認識を
行う(ステップ32)。この1文字認識は、本発明第一
実施例と同様に、例えば「Tsukumo etal;Handprinted K
anji Character Recognitionbased on Flexible Templa
te Maching,Proc of 11th Intl. Conf. Pattern Recogn
ition,pp.483-486 (1992).」を用いてコンピュータ上で
実現できる。文字認識結果に対する信頼度は、例えば、
第1位の認識結果に対する距離値と第2位の認識結果に
対する距離値との比をとればよく、1文字認識辞書40
2には、学習用の文字パタンから抽出した照合用の特徴
を格納する。1文字認識辞書402は、1文字認識部4
01からアクセス可能なメモリにセットすればよい。図
10に例示した文字列「Hundred」に対しては、
文字切り出し部301で7個の文字候補パタンに分割さ
れ、「T」「h」「?」「?」「d」「?」「d」とい
う認識結果を出力する。ここで、「?」は、1文字認識
部401が、該当する文字候補パタンに対して認識結果
を出力しなかったこと、すなわち棄却を意味する。
【0040】次に、上記1文字認識部401で得られた
結果を用いて、単語照合部601で照合を行う(ステッ
プ42)。照合用の単語は、単語辞書602に格納して
おく。単語辞書602は、単語照合部601が参照可能
なメモリ上に格納しておけばよい。単語照合部601で
は、単語辞書602に格納されている単語を1個ずつ取
り出し、1文字認識部401で得られた結果と文字単位
で一致数を計算し、一致数の大きい順にその単語を出力
する。一致数は、単語辞書中の単語を構成する文字が、
1文字認識部で得られた認識結果といくつ合致している
かで計算することができ、コンピュータ上で実現でき
る。図10に例示した文字列「Hundred」の場
合、単語辞書602に数字単語が登録されていると、登
録されている単語中、最も一致数の大きい「Thous
and」(一致数は3)が、次に「Hundred」
(一致数は2)が出力される。
【0041】次に、単語照合部601での照合が全文字
一致、すなわち1文字認識部401で得られた認識結果
が単語辞書602に格納されているものに完全に一致し
たかどうか、すなわち文字単位で全て合致したかを判定
する(ステップ52)。ここで、もし全文字一致してい
れば、文字列の評価値E2を計算する(ステップ6
2)。文字列の評価値E2は、1文字認識部401の認
識結果に対する信頼度から計算すればよく、例えば、1
文字認識部401で計算される信頼度の積または和で表
現すればよい。
【0042】この文字列評価値E2があらかじめ設定し
ている値SH4よりも大きいかどうかを判定する(ステ
ップ72)。もし、大きければ、1文字認識部で得られ
た認識結果を、入力文字列に対する認識結果として採用
する(ステップ82)。逆に、文字列評価値が、あらか
じめ設定している値よりも小さい場合には、入力文字列
に対する認識結果を棄却する。この際、各々の文字候補
パタンに対する1文字認識結果の信頼度を個別に吟味
し、信頼度の高い認識結果だけを出力することも可能で
ある。なお、上記SH4は、学習用の文字列から、誤認
識が生じない範囲を調査することにより単語毎に設定可
能である。また、各々の文字候補パタンに対する1文字
認識結果の信頼度も、1文字認識部の学習に用いたパタ
ンのうち、正読したパタンの信頼度を調査することによ
り設定可能である。
【0043】一方、図10に例示した文字列「Hund
red」の場合は、単語照合部601で計算した一致数
が、「Hundred」の文字数、7ではないことか
ら、以下に説明する処理を行う。まず、単語辞書601
に格納している単語各々に対し、一致しなかった部分U
iを検出する(ステップ102)。図10に例示した文
字列「Hundred」の場合は、一致数3で最大の
「Thousand」との不一致部は、「ousan」
である。そこで、図7のように入力画像から、「ous
an」に該当する部分のイメージを取り出す。取り出し
たイメージは該当する部分の文字列「ousan」と共
にn文字認識部501に送る。この不一致部分の検出
は、1文字認識部401の認識結果が単語と一致しない
部分に対し、文字切り出し部301で得た文字候補パタ
ンを統合することで抽出できる。
【0044】n文字認識部501では、図7に示したよ
うに、送られてきたイメージを同時に送られてきた文字
列と仮定して認識し、その確信度Kiを計算する(ステ
ップ112)。n文字認識辞書502には、学習用の文
字列パタンから抽出した照合用の特徴を格納する。n文
字認識辞書502は、n文字認識部501からアクセス
可能なメモリにセットすればよい。n文字認識部501
は、図7のように不一致部に該当する部分のイメージ対
し、1文字幅の数分の1幅程度の特徴抽出窓を使い、そ
の特徴抽出窓を文字列の一方の端からもう一方の端に移
動しながら、特徴抽出窓内で特徴を抽出していく。特徴
は、本発明第一実施例と同様に、例えば「Tsukumo eta
l;Handprinted Kanji Character Recognition based on
FlexibleTemplate Maching,Proc of 11th Intl. Conf.
Pattern Recognition,pp.483-486 (1992).」 で用いる
方向特徴を用いればよく、この特徴変化をオートマトン
の状態遷移に当てはめ、状態の遷移状況により認識す
る。具体的には、本発明第一実施例と同様に、例えば
「T.M.Ha et al;Off-line Handwritten Numeral String
Recognition by Combining Segmentation-based and Se
gmentation-free Methods, PatternRecognition, Vol.3
1, No.3 pp.257-272 (1998.3).」を用いてコンピュータ
上で実現できる。この方式で、不一致部に該当する部分
のイメージを認識した場合には、接触ブロック中の文字
数分の認識結果と認識結果に対する確信度Kiは、上記
の方式が認識結果と同時計算される尤度を用いる。この
他、文字列をその端点および交点を節とするグラフで表
現し、グラフマッチングを行ってもよい。
【0045】次に、n文字認識部501(ステップ11
2)で計算した、不一致部に該当する部分のイメージ認
識結果に対する確信度Kiの大きさを調べる(ステップ
122)。確信度KiがSH5以下であった場合には、
不一致部に該当する部分のイメージに対し、n文字認識
部501の認識結果を不採用とし、現在、仮定している
単語は、入力単語画像に対する認識結果ではないとし
(ステップ142)、一致数の次に大きい順に、前記ス
テップ102以降を繰り返す。図10に例示した文字列
「Hundred」の場合は、まず、一致数3の単語
「Thousand」との不一致部分、「ousan」
に相当するイメージを入力単語画像から抽出し、そのイ
メージが「ousan」と仮定した場合の信頼度を計算
する。この例では、その信頼度が前記SH5未満である
ので、不一致部に該当する部分のイメージが、「ous
an」ではないと判定する。これは、入力単語画像が仮
定していた「Thousand」ではないことを意味す
る。そこで、ステップ102に戻り、一致数が2と次に
大きい「Hundred」に対して同様の処理を繰り返
す。
【0046】n文字認識部501(ステップ112)で
計算した、不一致部に該当する部分のイメージ認識結果
に対する確信度Kiの大きさを調べ(ステップ12
2)。確信度KiがSH5以上であった場合には、n文
字認識部501で仮定していた文字列を不一致部に該当
する部分の認識結果として採用する(ステップ13
2)。図10で例示した文字列「Hundred」の場
合は、1文字認識で一致しているのが2箇所の「d」で
あることから、不一致部分の該当する箇所は、図7で示
すように「Hun」、「re」の2箇所となる。これら
2箇所の不一致部に該当するイメージに対し、それぞれ
「Hun」、「re」を仮定してn文字認識を行い、確
信度を算出する。この場合、「Hun」、「re」に該
当する2個のイメージに対するn文字認識の確信度は、
SH5以上であるので、それら2個のイメージは、それ
ぞれ「Hun」、「re」と判定する。なお、上記SH
5は、学習用のパタンに対して誤読が発生した際の確信
度の上限の値を調べることで設定可能である。
【0047】最後に、1文字認識部401で認識されて
いる2個の「d」と共に、入力単語画像に対する文字列
評価値E2を計算する(ステップ62)。文字列の評価
値は、1文字認識部401の認識結果に対する信頼度お
よびn文字認識部501の認識結果に対する確信度から
計算すればよく、例えば、1文字認識結果の信頼度およ
びn文字認識結果の確信度の積または和で表現すればよ
い。
【0048】この文字列評価値E2があらかじめ設定し
ている値SH4よりも大きいかどうかを判定する(ステ
ップ72)。もし、大きければ、単語照合で仮定してい
る単語を認識結果として採用する(ステップ82)。逆
に、文字列評価値が、あらかじめ設定している値よりも
小さい場合には、入力文字列に対する認識結果は棄却す
る。また、各々の文字候補パタンに対する1文字認識結
果の信頼度も、1文字認識部の学習に用いたパタンのう
ち、正読したパタンの信頼度を調査することにより設定
可能である。
【0049】上記では、単語照合部601での単語照合
時の一致数が大きい順に処理を行い、照合単語に対して
認識結果の不一致部分がなければ、その単語を入力単語
画像に対する認識結果とし、一致数の少ない単語のn文
字認識を省いているが、単語照合部601に格納されて
いる単語全てに対し、ステップ102以降の処理を適用
してもよい。その場合には、完全照合し、かつステップ
72における文字列評価値もSH4以上を満足する単語
が複数得られた場合には、文字列評価値の高い方を入力
単語画像に対する認識結果とすればよいし、1位、2位
の文字列評価値が僅差である場合には、両者を候補とし
て出力すればよい。
【0050】(第三実施例)次に、本発明第三実施例に
ついて図8を用いて説明する。図8は、イメージ格納部
11と、データ処理部21と、文字認識プログラムを記
録した媒体31とを備えて構成される。データ処理部2
1は、通常のコンピュータでよく、イメージ入力格納部
11は、データ処理部21内の主記憶装置または、外部
記憶装置により実現可能である。また、記録媒体31
は、フロッピーディスク、CD−ROM、DVD−RO
M、半導体メモリなどでよく、ネットワークを介して流
通する場合も含む。
【0051】文字認識プログラムは、記憶媒体31から
データ処理部21に読み込まれ、データ処理部21を制
御する。データ処理部21は、文字認識プログラムによ
り、まず、イメージ格納部11に入力された文字列画像
を、1文字毎の文字候補パタンを作成すると同時に、文
字同士が接触している部分を検出し、接触する文字数を
推定する。この時、1文字毎の文字候補パタンの作成
は、例えば「西脇、山田:黒色罫線枠帳票における接触
数字切り出し、電子情報通信学会情報・システムソサイ
エティ大会、D−12−3(1997).」を用いるこ
とで実現可能である。また、接触する文字数の推定も、
例えば文字列幅を文字列高で割ることで計算すればよ
い。
【0052】次に、1文字毎の文字候補パタンに対し
て、その文字種を判定すると同時に、その信頼度を計算
する。この1文字認識は、本発明第一実施例と同様に、
例えば「Tsukumo et al;Handprinted Kanji Character
Recognition based on Flexible Template Maching,Pro
c of 11th Intl. Conf. Pattern Recognition,pp.483-4
86 (1992).」を用いて実現できる。文字認識結果に対す
る信頼度も、例えば、第1位の認識結果に対する距離値
と第2位の認識結果に対する距離値との比をとればよ
い。
【0053】1文字認識の信頼度が低く、かつ、その文
字候補パタンが、前記文字切り出し部で検出した文字同
士が接触している部分から得たものであった場合に、そ
の文字候補パタンを含む文字同士が接触している部分に
対し、n文字認識を行い、認識結果と信頼度を計算す
る。その信頼度が高い場合に、n文字認識の認識結果を
採用するように動作する。このn文字認識部は、本発明
第一実施例と同様に、特徴は「Tsukumo et al;Handprin
ted Kanji CharacterRecognition based on Flexible T
emplate Maching,Proc of 11th Intl. Conf. PatternRe
cognition,pp.483-486 (1992).」 で用いる方向特徴を
用いればよく、識別は「T.M.Ha et al;Off-line Handwr
itten Numeral String Recognition by Combining Segm
entation-based and Segmentation-free Methods, Patt
ern Recognition, Vol.31, No.3 pp.257-272 (1998.
3).」を用いて実現できる。この他、文字列をその端点
および交点を節とするグラフで表現し、グラフマッチン
グを行ってもよい。なお、あらかじめ文字列中の文字数
が既知である場合には、n文字認識に何文字分に相当す
る接触ブロックであるかを渡して認識に用いる。なお、
上記の方式で接触ブロックを認識した場合には、接触ブ
ロック中の文字数分の認識結果と認識結果に対する信頼
度は、上記の方式により認識結果と同時計算される尤度
を用いればよい。
【0054】なお、本発明第二実施例における単語読み
取りについても、本発明第二実施例で説明した制御部2
01の動作を図6に示す手順でプログラム化し、前記記
録媒体31に記録しておくことで、本発明第三実施例と
同様に図8の構成で実現可能である。文字候補パタン作
成、1文字認識、n文字認識についても、本発明第二の
実施例と同様に、それぞれ「西脇、山田:黒色罫線枠帳
票における接触数字切り出し、電子情報通信学会情報・
システムソサイエティ大会、D-12-3(1997).」、「Tsuku
mo et al;Handprinted Kanji Character Recognition b
ased on Flexible Template Maching,Proc of 11th Int
l. Conf. Pattern Recognition,pp.483-486 (1992).」
ならびに「T.M.Ha et al;Off-line Handwritten Numera
l String Recognition by Combining Segmentation-bas
ed and Segmentation-free Methods, Pattern Recognit
ion, Vol.31, No.3pp.257-272 (1998.3).」の方法をプ
ログラム化することで実現でき、1文字認識確信度、n
文字認識信頼度も、本発明第二実施例で説明した方法に
より計算できる。
【0055】
【発明の効果】以上、詳細に説明してきたように、本発
明によれば、曖昧性の無い、認識精度の高い単語認識を
実現することができるとともに、処理速度の高速化を図
ることができる。
【図面の簡単な説明】
【図1】本発明第一実施例の文字認識装置の要部ブロッ
ク構成図。
【図2】本発明第一実施例の文字認識装置の動作を示す
フローチャート。
【図3】文字切り出しを説明するための図。
【図4】文字候補パタンの例を説明するための図。
【図5】n文字認識を説明するための図。
【図6】本発明第二実施例の文字認識装置の動作を示す
フローチャート。
【図7】本発明第二実施例のn文字認識部を説明するた
めの図。
【図8】本発明第三実施例の文字認識装置を説明するた
めの図。
【図9】従来の文字認識装置の要部ブロック構成図。
【図10】従来技術における文字認識を説明するための
図。
【符号の説明】
11、101 イメージ格納部 21 データ処理部 31 記録媒体 201 制御部 301 文字切り出し部 401 1文字認識部 402 1文字認識辞書 501 n文字認識部 502 n文字認識辞書 601 単語照合部 602 単語辞書 701 データバス

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 文字列画像を入力し記憶するイメージ格
    納手段と、 前記イメージ格納手段に入力された文字列画像に対し1
    文字毎の文字候補パタンを作成するとともに文字同士が
    接触している部分を検出し接触する文字数を推定する文
    字切り出し手段と、 前記文字切り出し手段により作成された1文字毎の文字
    候補に対しその文字種を判定するとともにその確信度を
    出力する1文字認識手段と、 前記1文字認識手段が判定に用いる1文字認識辞書と、 前記文字切り出し手段により検出された文字同士が接触
    している部分が前記文字切り出し手段によりn文字と推
    定された場合にこのn文字分の文字種を判定するn文字
    認識手段と、 前記n文字認識手段が判定に用いるn文字認識辞書と、 前記イメージ格納手段、前記文字切り出し手段、前記1
    文字認識手段、前記n文字認識手段を制御する制御手段
    とを備えたことを特徴とする文字認識装置。
  2. 【請求項2】 前記1文字認識手段により得た1文字認
    識結果および前記n文字認識手段により得たn文字認識
    結果にしたがって登録されている候補単語に対し文字の
    一致数の大きい順に照合した単語を出力する単語照合手
    段と、 前記単語照合手段が照合時に用いる単語辞書とを備えた
    請求項1記載の文字認識装置。
  3. 【請求項3】 前記制御手段は、前記文字切り出し手段
    により得た1文字毎の文字候補パタンに対し前記1文字
    認識手段が出力した信頼度が低くかつその文字候補パタ
    ンが前記文字切り出し部で検出した文字同士が接触して
    いる部分から得たものであった場合にはその文字候補パ
    タンを含む文字同士が接触している部分に対しn文字認
    識を行いその認識結果を採用する手段を含む請求項1記
    載の文字認識装置。
  4. 【請求項4】 前記制御手段は、前記文字切り出し手段
    により得た1文字毎の文字候補パタンに対し前記1文字
    認識手段が出力した認識結果に対する前記単語照合手段
    から得た照合結果に対し完全に一致するものがあれば文
    字列イメージに対する1文字毎の認識結果の全てに対す
    る確信度を調べいずれもある値以上であれば前記1文字
    認識手段が出力した認識結果を採用しそうでなければ入
    力した文字列イメージに対する認識を中止する手段と、 前記文字切り出し手段で得た1文字毎の文字候補パタン
    の前記1文字認識手段の認識結果に対する前記単語照合
    手段の照合結果に対し完全に一致するものがない場合に
    は1文字認識結果の異なる部分に相当する文字列イメー
    ジを照合を試みた単語の一致文字数の大きいものから順
    に単語照合で不一致となった部分の文字数と文字種とと
    もに前記n文字認識手段に送り込む手段と、 この送り込む手段により送り込まれた文字列イメージに
    対し前記n文字認識手段では当該文字列イメージの再認
    識を行いその認識結果およびその確信度を出力しその確
    信度がある値以上であれば照合中の単語を入力文字列に
    対する認識結果の最終候補として残し前記1文字認識手
    段が起動した部分については前記1文字認識手段が出力
    した確信度および前記n文字認識手段が起動した部分に
    ついては前記n文字認識手段が出力した確信度をそれぞ
    れ用いて照合中の文字列全体に対する評価値を計算し照
    合単語のうち前記最終候補として残った単語の中で一番
    評価値の高いものを入力文字列に対する認識結果とする
    手段とを含む請求項2記載の文字認識装置。
  5. 【請求項5】 前記文字切り出し手段は、文字同士が接
    触している部分から1文字毎の文字候補パタンを作成す
    るときに接触している文字の境界を文字同士が接触して
    いる部分の黒画素に対し文字列方向と垂直方向に当該黒
    画素をトレースした際の隣接するランのラン長の変化を
    用いて検出する手段を含む請求項3または4記載の文字
    認識装置。
  6. 【請求項6】 前記文字切り出し手段は、文字同士が接
    触している部分から1文字毎の文字候補パタンを作成す
    るときに接触している文字の境界を文字同士が接触して
    いる部分の文字ストロークに対する文字列方向と垂直な
    方向に対する極大点ならびに極小点を用いて検出する手
    段を含む請求項3または4記載の文字認識装置。
  7. 【請求項7】 前記n文字認識手段は、文字同士が接触
    する部分を1文字毎の文字候補パタンに分割せず全体で
    認識を行い認識結果の確信度を出力しその全体認識のた
    めの認識辞書をn文字認識辞書に格納する手段を含む請
    求項3または4記載の文字認識装置。
  8. 【請求項8】 前記n文字認識手段は、文字同士が接触
    する部分を1文字毎の文字候補パタンに分割せず全体で
    認識を行うときに文字列を囲む矩形を仮定しその矩形の
    高さに相当する高さおよび1文字分の文字幅以下の高さ
    を持つ領域を設定しその領域を前記矩形の一方から他方
    に移動させていくことにより得られた移動毎に得られる
    領域内の特徴の変化を用いて認識を行うとともに認識結
    果の確信度を出力しそのための認識辞書をn文字認識辞
    書に格納する手段を含む請求項3または4記載の文字認
    識装置。
  9. 【請求項9】 文字列画像を入力し記憶するステップ
    と、 記憶した文字列画像から1文字毎の文字候補パタンを作
    成するとともに文字同士が接触している部分を検出し接
    触する文字数を推定するステップと、 作成された1文字毎の文字候補に対しその文字種を判定
    するとともにその確信度を出力するステップと、 その確信度がある値以下でかつ文字同士が接触している
    部分に含まれている際にこの文字同士が接触している部
    分に対しn文字分の文字種を判定し確信度を出力するス
    テップと、 1文字の認識結果とn文字認識結果のそれぞれの確信度
    がある値以上の場合にそれを入力文字列に対する認識結
    果として出力するステップとを備えることを特徴とする
    コンピュータ上で動作する文字列認識プログラムを記録
    した機械読み取り可能な記録媒体。
  10. 【請求項10】 文字列画像を入力し記憶するステップ
    と、 記憶した文字列画像から1文字毎の文字候補パタンを作
    成するとともに文字同士が接触している部分を検出し接
    触する文字数を推定するステップと、 作成された1文字毎の文字候補に対しその文字種を判定
    するとともにその確信度を出力するステップと、 登録されている候補単語に対し文字の一致数の大きい順
    に照合した単語を出力するとともにそれぞれの照合単語
    に対し不一致部分を出力する単語照合ステップと、 この単語照合ステップにより得たそれぞれの照合単語に
    対する不一致部分に相当する画像を入力画像から獲得し
    その文字数と文字種を仮定した複数文字分の文字種を判
    定するとともにその確信度を出力するn文字認識ステッ
    プと、 1文字の認識結果とn文字認識結果のそれぞれの確信度
    がある値以上の場合にそれを入力文字列に対する認識結
    果として出力するステップとを備えることを特徴とする
    コンピュータ上で動作する文字列認識プログラムを記録
    した機械読み取り可能な記録媒体。
JP11165358A 1999-06-11 1999-06-11 文字認識装置および文字認識プログラムを記録した記録媒体 Pending JP2000353215A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP11165358A JP2000353215A (ja) 1999-06-11 1999-06-11 文字認識装置および文字認識プログラムを記録した記録媒体
US09/590,261 US6738519B1 (en) 1999-06-11 2000-06-09 Character recognition apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11165358A JP2000353215A (ja) 1999-06-11 1999-06-11 文字認識装置および文字認識プログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JP2000353215A true JP2000353215A (ja) 2000-12-19

Family

ID=15810860

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11165358A Pending JP2000353215A (ja) 1999-06-11 1999-06-11 文字認識装置および文字認識プログラムを記録した記録媒体

Country Status (2)

Country Link
US (1) US6738519B1 (ja)
JP (1) JP2000353215A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006107205A (ja) * 2004-10-06 2006-04-20 Nec Corp 文字列認識方法および装置
WO2011036830A1 (ja) * 2009-09-24 2011-03-31 日本電気株式会社 単語認識装置、方法及びプログラムが格納された非一時的なコンピュータ可読媒体並びに発送物区分装置
JP2012008791A (ja) * 2010-06-24 2012-01-12 Hitachi Computer Peripherals Co Ltd 帳票認識装置及び帳票認識方法
JP2012173959A (ja) * 2011-02-21 2012-09-10 Fuji Xerox Co Ltd 文字認識装置及びプログラム
JP2012230482A (ja) * 2011-04-25 2012-11-22 Ntt Docomo Inc 評価画像処理装置及び評価画像処理方法
JP2020123273A (ja) * 2019-01-31 2020-08-13 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
JP2020123272A (ja) * 2019-01-31 2020-08-13 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム

Families Citing this family (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8352400B2 (en) 1991-12-23 2013-01-08 Hoffberg Steven M Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
US7904187B2 (en) 1999-02-01 2011-03-08 Hoffberg Steven M Internet appliance system and method
JP4613397B2 (ja) * 2000-06-28 2011-01-19 コニカミノルタビジネステクノロジーズ株式会社 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP4136316B2 (ja) * 2001-01-24 2008-08-20 富士通株式会社 文字列認識装置
JP4031210B2 (ja) * 2001-03-30 2008-01-09 株式会社東芝 文字認識装置、文字認識方法、及び記録媒体
US20050097046A1 (en) 2003-10-30 2005-05-05 Singfield Joy S. Wireless electronic check deposit scanning and cashing machine with web-based online account cash management computer application system
US7707039B2 (en) 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
US8442331B2 (en) 2004-02-15 2013-05-14 Google Inc. Capturing text from rendered documents using supplemental information
US8799303B2 (en) * 2004-02-15 2014-08-05 Google Inc. Establishing an interactive environment for rendered documents
US7812860B2 (en) 2004-04-01 2010-10-12 Exbiblio B.V. Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device
US10635723B2 (en) 2004-02-15 2020-04-28 Google Llc Search engines and systems with handheld document data capture devices
US20060041484A1 (en) 2004-04-01 2006-02-23 King Martin T Methods and systems for initiating application processes by data capture from rendered documents
US8081849B2 (en) 2004-12-03 2011-12-20 Google Inc. Portable scanning and memory device
US9116890B2 (en) 2004-04-01 2015-08-25 Google Inc. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US20060098900A1 (en) 2004-09-27 2006-05-11 King Martin T Secure data gathering from rendered documents
US7990556B2 (en) 2004-12-03 2011-08-02 Google Inc. Association of a portable scanner with input/output and storage devices
US8621349B2 (en) 2004-04-01 2013-12-31 Google Inc. Publishing techniques for adding value to a rendered document
US20080313172A1 (en) 2004-12-03 2008-12-18 King Martin T Determining actions involving captured information and electronic content associated with rendered documents
US9143638B2 (en) 2004-04-01 2015-09-22 Google Inc. Data capture from rendered documents using handheld device
US8793162B2 (en) 2004-04-01 2014-07-29 Google Inc. Adding information or functionality to a rendered document via association with an electronic counterpart
US20060081714A1 (en) 2004-08-23 2006-04-20 King Martin T Portable scanning device
US7894670B2 (en) 2004-04-01 2011-02-22 Exbiblio B.V. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US20070300142A1 (en) * 2005-04-01 2007-12-27 King Martin T Contextual dynamic advertising based upon captured rendered text
WO2008028674A2 (en) 2006-09-08 2008-03-13 Exbiblio B.V. Optical scanners, such as hand-held optical scanners
US8146156B2 (en) * 2004-04-01 2012-03-27 Google Inc. Archive of text captures from rendered documents
US8713418B2 (en) 2004-04-12 2014-04-29 Google Inc. Adding value to a rendered document
US9460346B2 (en) 2004-04-19 2016-10-04 Google Inc. Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device
US8620083B2 (en) 2004-12-03 2013-12-31 Google Inc. Method and system for character recognition
US8874504B2 (en) 2004-12-03 2014-10-28 Google Inc. Processing techniques for visual capture data from a rendered document
US8489624B2 (en) 2004-05-17 2013-07-16 Google, Inc. Processing techniques for text capture from a rendered document
US20060008148A1 (en) * 2004-07-06 2006-01-12 Fuji Photo Film Co., Ltd. Character recognition device and method
US8346620B2 (en) 2004-07-19 2013-01-01 Google Inc. Automatic modification of web pages
US20100092095A1 (en) * 2008-10-14 2010-04-15 Exbiblio B.V. Data gathering in digital and rendered document environments
US7515752B2 (en) * 2004-08-27 2009-04-07 Corel Corporation Sketch recognition and enhancement
US7724958B2 (en) * 2004-09-07 2010-05-25 Gannon Technologies Group Llc Systems and methods for biometric identification using handwriting recognition
SE528063C2 (sv) * 2004-11-12 2006-08-22 Zi Decuma Ab Metod och anordning för segmenteringsbaserad igenkänning
RU2007135946A (ru) * 2005-02-28 2009-04-10 Зи Декума Аб (Se) Распознавание на основе сегментации
JP2006259830A (ja) * 2005-03-15 2006-09-28 Toshiba Corp 光学的文字認識装置および光学的文字認識結果確認方法
JP4672692B2 (ja) * 2007-03-14 2011-04-20 株式会社東芝 単語認識システムおよび単語認識プログラム
CN101430680B (zh) 2008-12-31 2011-01-19 阿里巴巴集团控股有限公司 一种无词边界标记语言文本的分词序列选择方法及系统
WO2010087886A1 (en) * 2009-01-27 2010-08-05 Gannon Technologies Group Llc Systems and methods for graph-based pattern recognition technology applied to the automated identification of fingerprints
DE202010018601U1 (de) 2009-02-18 2018-04-30 Google LLC (n.d.Ges.d. Staates Delaware) Automatisches Erfassen von Informationen, wie etwa Erfassen von Informationen unter Verwendung einer dokumentenerkennenden Vorrichtung
DE202010018551U1 (de) 2009-03-12 2017-08-24 Google, Inc. Automatische Bereitstellung von Inhalten, die mit erfassten Informationen, wie etwa in Echtzeit erfassten Informationen, verknüpft sind
US8447066B2 (en) 2009-03-12 2013-05-21 Google Inc. Performing actions based on capturing information from rendered documents, such as documents under copyright
US9081799B2 (en) 2009-12-04 2015-07-14 Google Inc. Using gestalt information to identify locations in printed information
US9323784B2 (en) 2009-12-09 2016-04-26 Google Inc. Image search using text-based elements within the contents of images
JP5075997B2 (ja) * 2011-03-30 2012-11-21 株式会社東芝 電子機器、プログラムおよび文字列認識方法
KR20130080515A (ko) * 2012-01-05 2013-07-15 삼성전자주식회사 디스플레이 장치 및 그 디스플레이 장치에 표시된 문자 편집 방법.
US9286514B1 (en) * 2013-10-17 2016-03-15 United Services Automobile Association (Usaa) Character count determination for a digital image
US11030752B1 (en) 2018-04-27 2021-06-08 United Services Automobile Association (Usaa) System, computing device, and method for document detection
US11961316B2 (en) * 2022-05-10 2024-04-16 Capital One Services, Llc Text extraction using optical character recognition

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62262194A (ja) 1986-05-08 1987-11-14 Oki Electric Ind Co Ltd 光学式文字読取装置
JPS63316288A (ja) 1987-06-19 1988-12-23 Nec Corp 文字認識装置
JPH01280887A (ja) 1988-01-07 1989-11-13 Seiko Epson Corp 文字認識方法
US5058182A (en) * 1988-05-02 1991-10-15 The Research Foundation Of State Univ. Of New York Method and apparatus for handwritten character recognition
JP2619499B2 (ja) 1988-10-19 1997-06-11 富士通株式会社 べた書き住所の文字認識後処理方式
JPH0348379A (ja) 1989-04-19 1991-03-01 Ricoh Co Ltd 文字認識方式
JPH03154985A (ja) 1989-11-13 1991-07-02 Nippon Telegr & Teleph Corp <Ntt> 最尤度単語認識方式
JP2991457B2 (ja) 1990-05-22 1999-12-20 グローリー工業株式会社 特殊連続数字の認識方法
JPH05114053A (ja) 1991-04-12 1993-05-07 Nippon Telegr & Teleph Corp <Ntt> 文字認識後処理方式
JPH05290217A (ja) 1992-04-15 1993-11-05 Ricoh Co Ltd 文字認識方法
JPH05298487A (ja) 1992-04-21 1993-11-12 Matsushita Electric Ind Co Ltd 英文字認識装置
JPH05307644A (ja) 1992-04-30 1993-11-19 Matsushita Electric Ind Co Ltd 文字認識装置
JPH05346974A (ja) 1992-06-16 1993-12-27 Matsushita Electric Ind Co Ltd 文字認識装置
JP3272842B2 (ja) * 1992-12-17 2002-04-08 ゼロックス・コーポレーション プロセッサベースの判定方法
JP3188580B2 (ja) 1993-11-17 2001-07-16 富士通株式会社 文字切り出し回路、及び文字切り出し方法
JP2734386B2 (ja) * 1994-12-20 1998-03-30 日本電気株式会社 文字列読み取り装置
JPH08202830A (ja) 1995-01-27 1996-08-09 Chugoku Nippon Denki Software Kk 文字認識システム
JP2751865B2 (ja) 1995-04-17 1998-05-18 日本電気株式会社 文字列認識装置
JPH10162104A (ja) 1996-11-27 1998-06-19 Hitachi Ltd 文字認識装置
US5966460A (en) * 1997-03-03 1999-10-12 Xerox Corporation On-line learning for neural net-based character recognition systems
KR100295360B1 (ko) * 1998-10-13 2001-11-26 윤종용 쉐이딩알고리즘을이용한영상처리방법
JP3154985B2 (ja) 1999-03-17 2001-04-09 株式会社エスディーシィー 物品収納兼包装ケース

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006107205A (ja) * 2004-10-06 2006-04-20 Nec Corp 文字列認識方法および装置
JP4600651B2 (ja) * 2004-10-06 2010-12-15 日本電気株式会社 文字列認識方法および装置
WO2011036830A1 (ja) * 2009-09-24 2011-03-31 日本電気株式会社 単語認識装置、方法及びプログラムが格納された非一時的なコンピュータ可読媒体並びに発送物区分装置
JP5621777B2 (ja) * 2009-09-24 2014-11-12 日本電気株式会社 単語認識装置、方法及びプログラムが格納された非一時的なコンピュータ可読媒体並びに発送物区分装置
US9101961B2 (en) 2009-09-24 2015-08-11 Nec Corporation Word recognition apparatus, word recognition method, non-transitory computer readable medium storing word recognition program, and delivery item sorting apparatus
JP2012008791A (ja) * 2010-06-24 2012-01-12 Hitachi Computer Peripherals Co Ltd 帳票認識装置及び帳票認識方法
JP2012173959A (ja) * 2011-02-21 2012-09-10 Fuji Xerox Co Ltd 文字認識装置及びプログラム
JP2012230482A (ja) * 2011-04-25 2012-11-22 Ntt Docomo Inc 評価画像処理装置及び評価画像処理方法
JP2020123273A (ja) * 2019-01-31 2020-08-13 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
JP2020123272A (ja) * 2019-01-31 2020-08-13 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
JP7279381B2 (ja) 2019-01-31 2023-05-23 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム
JP7279382B2 (ja) 2019-01-31 2023-05-23 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム

Also Published As

Publication number Publication date
US6738519B1 (en) 2004-05-18

Similar Documents

Publication Publication Date Title
JP2000353215A (ja) 文字認識装置および文字認識プログラムを記録した記録媒体
US7623715B2 (en) Holistic-analytical recognition of handwritten text
US5315667A (en) On-line handwriting recognition using a prototype confusability dialog
US5787197A (en) Post-processing error correction scheme using a dictionary for on-line handwriting recognition
JP3445394B2 (ja) 少なくとも二つのイメージセクションの比較方法
JPS63182793A (ja) 文字切り出し方式
JP3092576B2 (ja) 文字認識装置
Madhavaraj et al. Improved recognition of aged Kannada documents by effective segmentation of merged characters
JP3209197B2 (ja) 文字認識装置及び文字認識プログラムを記録した記録媒体
JP2761679B2 (ja) オンライン手書き文字認識装置
JP2903779B2 (ja) 文字列認識方法及びその装置
JP2856409B2 (ja) 文字認識装置および方法
JP2000207495A (ja) 文字認識装置、文字学習装置およびコンピュ―タ可読記録媒体
JP3130392B2 (ja) 文字認識装置
JP2851865B2 (ja) 文字認識装置
JPH08202830A (ja) 文字認識システム
JP2002042138A (ja) 画像照合装置、画像照合方法、およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH01265378A (ja) 欧文文字認識方式
JPH0340186A (ja) 文字認識装置
JP2001005913A (ja) 文字認識装置及び方法並びに記録媒体
JPH01191992A (ja) 文字認識装置
JP2002074269A (ja) 文字認識方法
JPH04363780A (ja) 文字列認識方法及びその装置
JPS5866175A (ja) 図形認識装置
JPH0652367A (ja) 文字認識結果の後処理方法