JP2002216076A - 文字列認識装置 - Google Patents

文字列認識装置

Info

Publication number
JP2002216076A
JP2002216076A JP2001015349A JP2001015349A JP2002216076A JP 2002216076 A JP2002216076 A JP 2002216076A JP 2001015349 A JP2001015349 A JP 2001015349A JP 2001015349 A JP2001015349 A JP 2001015349A JP 2002216076 A JP2002216076 A JP 2002216076A
Authority
JP
Japan
Prior art keywords
character
word
character string
key
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001015349A
Other languages
English (en)
Other versions
JP4136316B2 (ja
Inventor
Yoshinobu Hotta
悦伸 堀田
Katsuto Fujimoto
克仁 藤本
Satoshi Naoi
聡 直井
Misako Suwa
美佐子 諏訪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2001015349A priority Critical patent/JP4136316B2/ja
Priority to US10/020,249 priority patent/US7136526B2/en
Priority to CNB021023530A priority patent/CN100474331C/zh
Publication of JP2002216076A publication Critical patent/JP2002216076A/ja
Application granted granted Critical
Publication of JP4136316B2 publication Critical patent/JP4136316B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 文字列中からキー単語の自動抽出を行なうこ
とができ、また、複数文字から成るキー単語を精度良く
抽出することができ、単語認識に際し誤読することがな
い文字列認識装置を提供すること。 【解決手段】 キー文字コード抽出手段1により、認識
対象とする文字列群(コード)からキー単語の自動抽出
を行ない、それらを登録する。次に、キー単語抽出手段
2により、文字列イメージから、個別文字を切り出して
文字認識を行い、上記キー文字コード抽出手段1により
抽出/登録されたキー単語に相当する文字列を抽出す
る。そして、文字列イメージから、キー単語で区切られ
た単語領域を抽出し、単語認識手段3により単語認識を
行う。さらに、検証手段4により単語認識結果を検証
し、最終的な文字列認識結果を出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】近年、文書入力磯器として文
字認識装置OCRやソフトウェアOCRの需要が増加し
ている。本発明は、この文字認識装置における文字列認
識装置に関し、特に手書き文字列を認識するのに有効な
文字列認識装置に関するものである。本発明が対象とす
る手書き文字列は、住所、氏名、大学名、銀行名など一
般帳票において記入される種々の文字列であり、従来の
ように文字列先頭から1文字ずつ切り出して文字認識し
ていくのではなく、文字列を複数の部分文字列に分解
し、各部分文字列ごとに含まれる単語を一括して認識す
る。これにより、手書き文字列に特有の問題である文字
同士の接触や、分離文字の存在に対応することが可能で
ある。なお、本発明が対象とする文字認識装置は、上記
した手書き用文字認識装置だけでなく、印刷文字認識装
置、携帯情報端末における文字認識装置等、広い意味で
の文字認識装置に適用することができる。
【0002】
【従来の技術】手書き文字列に対して、文字列を部分文
字列に分解して単語認識を行なう方式としては、これま
でに、手書き住所を対象に都道府県市区郡といった住所
の切れ目となる文字(キー文字)を見つけ、それらの文
字間に挟まれた領域を単語認識していくものが提案され
ている(例えば特開平11−161740号公報、特開
平11−328315号公報参照)。しかし、上記従来
のものは、手書き住所を対象にしたものであり、住所以
外の一般の手書き文字列に対するものはこれまでになか
った。また、住所では文字列の区切りとなる文字が1文
字だけであり、キー文字が複数文字、すなわちキー単語
になる場合は扱っていなかった。
【0003】
【発明が解決しようとする課題】従来の手書き住所認識
におけるキー文字抽出方式では、予めキー文字が{都,
道,府,県,市,区,郡,町,村}と決定されていた。
しかし、対象が住所以外ではその都度キー文字を設定し
なおす必要があった。また、従来法では文字列中から文
字数1のキー文字しか抽出していないため、文字数が複
数のキー単語になると、キー単語内の文字同士の接触も
あり、従来方式をそのまま適用しただけではキー単語抽
出が失敗していた。さらに、従来の単語認識では精度の
高いリジェクト処理が行なわれていないため、正解と全
く違う単語に誤読する場合があり、ユーザの印象を悪く
していた。本発明は、上記従来技術の問題点を解決する
ためになされたものであって、その目的とするところ
は、文字列中からキー単語の抽出を自動で行なうことが
でき、また、キー単語が複数文字から成る場合でも精度
良くキー単語を抽出することができ、さらに、単語認識
に際し、全く異なる単語に誤読することがない文字列認
識装置を提供することである。
【0004】
【課題を解決するための手段】図1は本発明の概要を示
す図である。上記の課題を解決するため、本発明におい
ては同図に示すように、キー文字コード抽出手段1によ
り、認識対象とする文字列群(コード)からキー文字
(キー単語)の自動抽出を行ない、それらを登録する。
これにより、図1に示すように、県、市、区、町等の住
所認識におけるキー文字に加え、例えば、信用組合、支
店、農業協同組合、支所等のキー単語が登録される。ま
た、相関を持って出現する文字列の組を抽出することに
より、「信用組合」−「支店」等のように、共に現れる
確率が高いキー単語が組が抽出される。次に、キー単語
抽出手段2により、文字列イメージから、個別文字を切
り出して文字認識を行い、上記キー文字コード抽出手段
1により抽出/登録されたキー単語に相当する文字列を
言語処理と融合して精度よく抽出する。そして、文字列
イメージから、キー単語で区切られた単語領域を抽出し
単語認識手段3により単語認識を行う。さらに、検証手
段4により単語認識結果を検証し、最終的な文字列認識
結果を出力する。
【0005】
【発明の実施の形態】図2は本発明の実施例の文字列認
識装置の全体の概略構成を示す図である。同図におい
て、キー文字コード自動抽出処理11では、認識対象文
字列群(文字コード群)から、キー文字コード、キー文
字列コードを自動抽出する(以下では、文字コード、文
字列コードを合わせて文字コードという)。ここで、認
識対象とする文字列群、例えば、住所、氏名、大学名、
金融機関名などは特定されているとする。キー文字コー
ド自動抽出処理11では、それらの対象文字列群に対し
て、出現する文字コードを調べ、出現頻度の高い文字
や、文字列単位で見たときに出現頻度の高い文字、文字
列をキー文字コードとして登録する。さらに、文字同士
の出現の相関を調べる。相関とは、例えば、文字コード
Aが出現したときは文字コードBが出現する確率が高い
とか、文字コードCが出現したときは文字コードD、文
字コードEが同時に出現する確率が高い、などといった
関係である。このように相関を持って出現する文字コー
ドの組も同時にキー文字コードとして登録していく。以
上の処理により、例えば住所では、{県,市,区,町}
{県,郡,町}{都,区,町}がキー文字として抽出で
き、金融機関名では{銀行,支店}{信用組合,営業
部}{農業協同組合,支所}などのキー文字が自動で抽
出できる。住所の場合を例にとると、必ずしも住所階層
の区切りとなっていない文字もキー文字として用いるこ
とができる。以上のようにして抽出された文字コード
は、キー文字コードとして登録される。
【0006】キー文字/キー単語抽出処理12では、後
述するように手書き文字列(イメージデータ)から個別
文字を切り出し、文字認識を行って上記キー文字コード
自動抽出手段11により抽出されたキー文字コードに相
当したキー文字、キー単語を抽出し登録する。単語領域
抽出処理13では、手書き文字列(イメージ)から、上
記キー文字、キー単語により区切られた単語領域を抽出
する。例えば、手書き文字列が「東京信用組合日比谷支
店」の場合、「信用組合」、「支店」により区切られた
「東京」、「日比谷」の領域を単語領域として抽出す
る。単語認識処理14では、上記抽出された単語領域の
文字イメージを正規化して特徴抽出を行い、単語特徴辞
書等の特徴データと照合して、単語認識を行う。なお、
単語認識手法としては、例えば、前記した 特開平11
−161740号公報、特開平11−328315号公
報で開示される手法や、本出願人が先に提案した特願2
000−304758号に開示される手法を用いること
ができる。
【0007】上記のように、キー単語間に挟まれた単語
領域に対して、単語認識を行なうとともに、以下のよう
にして、単語認識結果の検証を行う。 (i) 文字切り出し/文字認識処理15において、個別文
字の切り出しを行って、文字認識処理も行う。そして、
文字認識結果の上位n位以内に単語認識された単語内の
文字のうち閾値以上の割合が含まれている場合に、単語
認識手段14による単語認識結果を出力し、そうでない
場合はリジェクトする。これにより、単語認識における
極端な誤読を減らすことができる。 (ii)さらに、図2の点線に示すように、文字数推定処理
17により、文字数比較により単語認識結果を検証する
ようにしてもよい。すなわち、単語領域を一括認識した
際に、認識した単語内の文字数と単語イメージから推定
される文字数の比較を行ない、両者の文字数が閾値以上
異なる場合に単語認識結果をリジェクトする。文字数推
定の方法としては、単語イメージに外接する矩形の高さ
と幅の比や単語イメージに対して周辺分布をとり、周辺
分布の切れ目位置・外接矩形高さなどから算出される数
を用いることができる。 (iii) 線密度/周辺分布による検証処理16では、文字
特徴の合成によって単語特徴を生成した場合、後述する
ように、文字特徴同士の合成位置を逆算し各位置で単語
イメージ上を分割し、各分割領域内で算出された線密度
や周辺分布と、単語認識された単語の各文字が予め持つ
線密度や周辺分布とを比較する。そして、両者が異なる
場合に単語認識結果をリジェクトすることにより、単語
認識結果を検証する。
【0008】以下、上記キー文字コード自動抽出処理、
キー文字/キー単語抽出処理、および線密度/周辺分布
による検証処理について説明する。 (1)キー文字コード自動抽出処理、キー文字/キー単
語抽出処理 図3は、上記キー文字コード自動抽出処理、キー文字/
キー単語抽出処理の実施例を示す図である。キー文字コ
ード自動抽出処理11において、まず、処理11aにお
いて、認識対象文字列コードから出現頻度の高い文字
や、文字列単位で見たときに出現頻度の高い文字、文字
列をキー文字コードとして抽出する。さらに、処理11
bにおいて、前記したように、相関を持って出現する文
字コードの組を抽出し、これらの文字の組をキー文字コ
ードとして登録していく。図4に認識対象文字列群と、
そこから抽出されるキー文字コードの一例を示す。図4
(a)の認識対象文字列群から出現頻度の高い文字コー
ドを抽出すると、例えば図4(b)に示すように、県、
都、…等の住所認識における文字に加え、信用組合、商
工信用組合等の金融機関名や農業協同組合名等のキー文
字コードが抽出される。また、「……県信用組合」、
「……県農業協同組合」等のように「県」等の文字が付
された文字列の出現頻度が高ければ、これもキー文字コ
ードとして抽出される。また、文字同士の出現の相関を
調べると、図4(c)に示すように相関の高い文字コー
ドの組が抽出される。なお、文字認識で誤読の生じにく
い文字を予め登録しておき、上記キー文字コードを抽出
する際、上記登録された文字をキー文字コードとして抽
出しておけば、文字イメージからのキー単語抽出処理に
おいて、より確実にキー単語を抽出することが可能とな
る。
【0009】キー文字/キー単語抽出処理12では、個
別文字切り出し処理12aにおいて手書き文字列(イメ
ージデータ)から個別文字を切り出し、前記したように
文字認識を行って上記キー文字コード自動抽出手段11
により抽出されたキー文字コードに相当したキー文字、
キー単語を抽出する。以下、キー文字が複数文字から成
るもの、すなわちキー単語の抽出について説明する。こ
こでは、例として、金融機関名を取り上げ、「○○信用
組合△△支店」や「○○農業協同組合△△支所」などか
らキー単語として「信用組合」「農業協同組合」を抽出
することを考える。なお、県,市,区,町等の1文字の
キー文字は、以下に説明する文字認識・キー単語/文字
抽出処理で、キー単語の抽出と同様に抽出することがで
きる。まず、一般的なキー単語の抽出について説明す
る。文字認識・キー文字/単語抽出処理12bでは、切
り出された個別文字について、文字認識を行なってい
き、各文字ごとに認識結果の上位n位候補の距離値を見
ていく。距離値が閾値TH1以下の候補の中に予め登録
されているキー単語中の文字が属していたら、それを着
目文字のキー文字候補とする。キー単語中の文字が複数
属している場合は複数のキー文字候補を出しておく。文
字列中のすべての文字についてこの処理を行ない、キー
文字候補の文字並びの中にキー単語と同一の文字列が含
まれている場合に、これらをキー単語として抽出する。
【0010】図5に上記個別文字切り出し、文字認識・
キー文字/単語抽出処理のフローを示す。ステップS1
において個別文字を切り出し、ステップS2において切
り出した文字の文字認識を行う。文字認識は、切り出し
た文字から特徴を抽出し、特徴データを格納した辞書と
の照合を行って候補文字を抽出し、切り出した文字と候
補文字との距離値を求めることにより行う。ステップS
3において、以上のようにして求めた文字認識結果の上
位n位の候補文字を抽出する。ステップS4において、
候補文字の距離値が閾値TH1より小さいかを調べる。
候補文字の距離値が閾値TH1より小さければ、ステッ
プS5において、上記候補文字が、キー文字コード自動
抽出処理11において登録されたキー単語中に含まれて
いるかを調べる。含まれている場合には、ステップS6
において、上記文字をキー文字候補として登録する。以
上の処理を全ての文字の処理が終わるまで繰り返し、全
ての文字についての処理が終わったら、ステップS7か
らステップS8に行き、キー文字候補の文字並びの中
に、キー文字コード自動抽出処理11において登録され
たキー単語と同一の文字列が含まれているものをキー単
語として抽出する。
【0011】一方、上記文字認識と同時に、単語認識/
キー単語抽出処理12cにおいて、個別文字として切り
出した文字について単語認識を行う。例えば図6に示す
「支店」ように、小さく書かれた文字同士が接触してい
る場合、文字切り出しをした時点で、この接触文字を1
文字として捉えてしまうことがある。このような場合に
備え、単語認識/キー単語抽出処理12cにおいて、1
文字として切り出された領域に対して文字特徴に加えて
単語特徴でも照合を行なう。そして、単語特徴による照
合で距離条件を満たした場合は、これをキー単語として
抽出する。
【0012】上記文字認識・キー文字/単語抽出処理に
おいて、予め登録されたキー単語の一部の文字が抽出さ
れた場合には、次のように処理を行う。 (i) 多段閾値による2段階抽出 文字列中からキー単語の一部のみが抽出されたとき、前
後のキー文字抽出処理12dでは、その前後の文字認識
結果に対してキー単語抽出の距離値条件を緩め、再度抽
出処理を行なう。つまり、通常はある文字に対する文字
認識結果に対し、前記距離値TH1以上の認識結果候補
の中にキー文字が含まれている場合にキー文字候補とし
て抽出するが、抽出されたキー文字の前後の文字につい
ては、距離値TH2(TH2>TH1)以上の認識結果
候補の中からキー文字を抽出する。これにより、キー単
語の一部の文字の字形変形が大きい場合でも、キー単語
の一部として抽出することができる。
【0013】(ii)両端認識によるキー単語抽出 文字同士の接触の多い文字列では、キー単語に属す個々
の文字を全て切り出して認識することが困難なことが多
い。例えば、「農業協同組合」というキー単語イメージ
の中で、「業協」の部分が複雑に接触していて、文字切
り出しでうまく切り出せない場合が生じる。そこで、両
端認識によるキー文字抽出処理12eを行う。キー文字
抽出処理12eでは、文字数がN文字以上のキー単語に
関して、文字列の先頭と終端の文字が抽出され、さらに
全文字数のP%以上の文字が抽出された時点で、キー単
語が抽出されたものとみなす。上記N,Pについては実
験により求めた値を用い、例えばP=60などとする。
「農業協同組合」を例にとると、「農業○○組合」や
「農○○同組合」とキー文字候補が抽出された時点で、
この文字列を「農業協同組合」と確定する。 (iii) 部分認識による部分キー単語抽出 キー単語の先頭の文字がその前の文字と接触している
と、正しく抽出することができず、上記両端認識方式が
うまく適用できない。そこで、部分認識によるキー単語
抽出処理12fを行う。部分認識によるキー単語抽出処
理12fでは、キー単語のうち文字数がM文字以上のキ
ー単語に関し、文字列前半の一部の文字と後半の一部の
文字が認識できた時点で、それらの部分文字列両端に対
して、上記(ii)の両端認識によるキー単語抽出を行い、
条件を満たした時点でこの部分文字列を部分キー単語と
して抽出する。「農業協同組合」を例にとると、「○○
○業△△組合」が認識された時点で、この文字列に含ま
れるキー単語を「農業協同組合」と推定する。しかし
「農」の位置が不明なので、「業」以降を「業協同組
合」と確定する。
【0014】以上のようにしてキー単語が抽出された
ら、単語認識によるキー単語検証処理12gにおいて、
抽出されたキー単語の検証を行う。単語認識によるキー
単語検証処理12gにおいては、キー単語が抽出された
時点で、キー単語に対する単語特徴を生成する。そし
て、上記キー単語抽出処理により抽出されたキー単語領
域に対して、単語認識処理を行ない、距離条件を満たし
たもののみをキー単語として抽出する。また、単語イメ
ージによってはキー単語でない文字の組合せに対して単
語特徴による照合で誤読しやすい場合が存在する。そこ
で、このような誤読しやすい単語イメージを類似単語特
徴として単語特徴辞書に追加しておき、正しい単語特徴
と詳細識別する際に用いることにより、キー単語の抽出
精度を向上させることができる。
【0015】(2)線密度/周辺分布による検証処理 前記図2で説明したように、キー単語で区切られた単語
領域を抽出し、キー単語で区切られた単語領域に対し
て、単語認識を行なうとともに、文字切り出し・文字認
識による検証、文字数推定による単語認識結果の検証を
行い、さらに、単語認識結果について、線密度/周辺分
布による検証処理を行う。以下、図7、図8により線密
度/周辺分布による検証処理について説明する。ここで
は、上記単語認識処理14における単語認識処理が、文
字特徴の合成によって単語特徴を生成し、該単語特徴
と、抽出された単語領域の単語イメージの特徴とを照合
して単語認識する場合について説明する。前記単語認識
処理14により得られた単語認識結果について、文字特
徴合成位置の算出処理16aにより、文字特徴同士の合
成位置を逆算する。すなわち、単語特徴を生成して単語
認識する方式で単語照合を行なったときに用いた単語テ
ンプレートから文字特徴同士の合成位置を逆算する。例
えば、図8に示すように、「富士」という単語イメージ
の照合結果として「七十七」が得られたら、その単語テ
ンプレートから、合成位置を逆算し、「七十七」の各文
字の合成位置を求める。合成位置は単語正規化イメージ
上での位置となるので、単語領域の分割処理16bで
は、その位置を単語イメージ上の位置に変換し、変換さ
れた各位置で単語イメージ上を分割する。例えば図8に
示すように「七十七」の各文字の合成位置を単語イメー
ジ上の位置に変換し、「富士」という単語イメージを分
割する。
【0016】そして、線密度、周辺分布算出処理16c
において、分割領域ごとに線密度、あるいは、周辺分布
を算出する。例えば図8の例では、「富士」という単語
イメージについて、分割された各領域の線密度を算出す
る。一方、線密度、周辺分布算出処理16dにおいて、
単語認識結果の各文字について、線密度辞書あるいは周
辺分布辞書等を参照して、各文字が予め持つ線密度ある
いは周辺分布を抽出する。例えば、図8の例では、「七
十七」という単語の各文字の線密度を抽出する。つい
で、比較処理16eにおいて、各分割領域内で算出され
た線密度や周辺分布と、単語認識された単語の各文字の
線密度あるいは周辺分布とを比較する。そして、両者が
異なる場合に単語認識結果をリジェクトする。例えば、
図8の例では、「富士」という単語イメージを分割した
各領域内の線密度と、「七十七」という単語の各文字が
持つ線密度は異なるので、単語認識結果である「七十
七」はリジェクトされる。
【0017】(付記1) 文字コードで表される認識対
象とする文字列カテゴリから文字列の節となるキー単語
のコード列を自動抽出するキー文字コード抽出手段と、
文字列イメージ中から、上記キー文字コード抽出手段に
より抽出されたキー単語、もしくは、その一部を抽出す
るキー単語抽出手段と、抽出されたキー単語により決定
される部分領域内の文字列に対して一括認識する認識手
段と、一括認識した結果を検証する検証手段とを備えた
ことを特徴とする文字列認識装置。 (付記2) 上記キー単語抽出手段は、文字列イメージ
中からキー単語を抽出する際に、キー単語を構成する文
字の一部のみが抽出された場合に、その前後の文字につ
いてキー文字としての抽出条件を緩め、再度文字抽出を
行なうことを特徴とする付記1の文字列認識装置。 (付記3) 上記キー単語抽出手段は、文字列イメージ
中からキー単語を抽出する際に、キー単語を構成する文
字のうち、その先頭文字と終端文字、およびキー単語に
含まれる文字の一定の割合以上が抽出された場合に、そ
の部分文字列をキー単語とみなすことを特徴とする付記
1または付記2の文字列認識装置。 (付記4) 上記キー単語抽出手段は、文字列イメージ
中からキー単語を抽出する際に、キー単語を構成する文
字のうち、離れた位置の2文字以上が抽出され、その文
字間に挟まれた領域内の文字のうち、一定の割合以上が
抽出された場合に、その部分文字列をキー単語の部分文
字列として抽出することを特徴とする付記1,2または
付記3の文字列認識装置。 (付記5) 上記キー単語抽出手段は、文字列イメージ
中からキー単語を抽出する際に、抽出されたキー単語、
もしくはその部分キー単語に対して、単語として一括認
識を行ない、単語としての確からしさを検証することを
特徴とする付記1,2,3または付記4の文字列認識装
置。 (付記6) 上記キー単語抽出手段は、文字列イメージ
中からキー単語を抽出する際に、1文字として切り出さ
れた領域に対して、文字特徴に加えて、単語特徴でも照
合を行い、キー単語を構成する文字列、もしくはキー単
語を抽出することを特徴とする付記1,2,3,4また
は付記5の文字列認識装置。 (付記7) 上記キー単語抽出手段は、文字列イメージ
中からキー単語の単語特徴を用いて単語抽出を行なう際
に、キー単語に誤読されやすい単語が類似単語として登
録された辞書を参照して、単語認識における認識精度を
あげることを特徴とする付記5または付記6の文字列認
識装置。 (付記8) 上記キー文字コード抽出手段は、文字列カ
テゴリから文字列の節となるキー単語のコード列を抽出
する際に、認識対象文字列全体の中で出現頻度の高い文
字、文字列単位で見たときに出現頻度の高い文字、およ
び/または、高い相関を持って出現する文字の組をキー
単語として抽出することを特徴とする付記1の文字列認
識装置。 (付記9) 文字認識で誤読の生じにくい文字を予め登
録しておき、上記キー文字コード抽出手段は、文字列カ
テゴリから文字列の節となるキー単語のコード列を抽出
する際に、上記登録された文字をキー文字として抽出す
ることを特徴とする付記1または付記8の文字列認識装
置。 (付記10) 上記認識手段は、単語領域を一括認識す
る際、単語認識を行なうとともに、その領域に対し文字
切り出しと文字認識も行ない、単語認識結果に含まれる
文字が、上記文字認識結果中に、予め定められた上位n
位以内に閾値数以上含まれる場合に単語認識結果を確定
することを特徴とする付記1の文字列認識装置。 (付記11) 上記認識手段は、文字特徴を合成するこ
とにより生成した単語特徴を用いて単語領域を一括認識
し、 上記検証手段は、マッチングしたテンプレートから単語
イメージにおける各文字の分割位置を算出し、各分割位
置で求めた単語イメージの線密度と、認識した単語の各
文字が保持する線密度を比較し、両者の線密度の総和、
もしくは、大小比率が閾値以上異なる場合に単語認識結
果をリジェクトすることを特徴とする付記1または付記
10の文字列認識装置。 (付記12) 上記認識手段は、文字特徴を合成するこ
とにより生成した単語特徴を用いて、単語領域を一括認
識し、上記検証手段は、マッチングしたテンプレートか
ら単語イメージににおける各文字の分割位置を算出し、
各分割位置で求めた単語イメージの周辺分布と、認識し
た単語の各文字が保持する周辺分布を比較し、両者の周
辺分布の総和、もしくは大小比率が閾値以上異なる場合
に単語認識結果をリジェクトすることを特徴とする付記
1または付記10の文字列認識装置。 (付記13) 上記認識手段は、文字特徴を合成するこ
とにより生成した単語特徴を用いて単語領域を一括認識
し、上記検証手段は、認識した単語内の文字数と、単語
イメージから推定される文字数の比較を行ない、両者の
文字数が閾値以上異なる場合に単語認識結果をリジェク
トすることを特徴とする付記1または付記10の文字列
認識装置。 (付記14) 文字列イメージを認識するプログラムを
記録した記録媒体であって、上記プログラムは、文字コ
ードで表される認識対象とする文字列カテゴリから文字
列の節となるキー単語のコード列を自動抽出し、文字列
イメージ中から、上記抽出されたキー単語、もしくは、
その一部を抽出し、抽出されたキー単語により決定され
る部分領域内の文字列に対して一括認識を行い、一括認
識した結果を検証することを特徴とする文字列イメージ
を認識するプログラムを記録した記録媒体。
【0018】
【発明の効果】以上説明したように本発明においては、
以下の効果を得ることができる。 (1)文字コードで表される認識対象とする文字列カテ
ゴリから文字列の節となるキー単語のコード列を自動抽
出し、文字列イメージ中から、上記キー文字コード抽出
手段により抽出されたキー単語、もしくは、その一部を
抽出し、抽出されたキー単語により決定される部分領域
内の文字列に対して一括認識し、一括認識した結果を検
証するようにしたので、文字列中からキー単語の抽出を
自動で行なうことができ、また、キー単語が複数文字か
ら成る場合でも精度良くキー単語を抽出することができ
る。さらに、単語認識結果に対して検証処理を入れてい
るため、単語認識で全く異なる単語に誤読することが減
少する。 (2)キー単語を構成する文字の一部のみが抽出された
場合に、その前後の文字についてキー文字としての抽出
条件を緩め、再度文字抽出を行なうことにより、キー単
語の一部の文字の字形変形が大きい場合でも、精度よく
キー単語を抽出することができる。 (3)キー単語を構成する文字のうち、その先頭文字と
終端文字、およびキー単語に含まれる文字の一定の割合
以上が抽出された場合に、その部分文字列をキー単語と
みなようにすることにより、キー単語の文字同士が接触
していても、精度良くキー単語を抽出することができ
る。 (4)キー単語を構成する文字のうち、離れた位置の2
文字以上が抽出され、その文字間に挟まれた領域内の文
字のうち、一定の割合以上が抽出された場合に、その部
分文字列をキー単語の部分文字列として抽出ことによ
り、キー単語の端の文字がその周辺の文字と接触してい
も、精度良くキー単語を抽出することができる。 (5)抽出されたキー単語、もしくはその部分キー単語
に対して、単語として一括認識を行ない、単語としての
確からしさを検証することにより、文字認識精度が低い
場合でも、精度良くキー単語を抽出することができる。 (6)1文字として切り出された領域に対して、文字特
徴に加えて、単語特徴でも照合を行い、キー単語を構成
する文字列、もしくはキー単語を抽出することにより、
文字数が少ないキー単語内の文字が接触している場合で
も、キー単語を抽出することができる。 (7)キー単語に誤読されやすい単語が類似単語として
登録された辞書を参照して、単語認識における認識精度
をあげることにより、精度良くキー単語を抽出すること
ができる。 (8)キー単語のコード列を抽出する際に、認識対象文
字列全体の中で出現頻度の高い文字、文字列単位で見た
ときに出現頻度の高い文字、および/または、高い相関
を持って出現する文字の組をキー単語として抽出するこ
とにより、認識対象文字列(コード)から自動的にキー
単語を抽出することが可能となる。 (9)文字認識で誤読の生じにくい文字を予め登録して
おき、文字列カテゴリから文字列の節となるキー単語の
コード列を抽出する際に、上記登録された文字をキー文
字として抽出することにより、より確実にキー単語を抽
出することができる。 (10)キー文字/キー単語で区切られた単語領域を一
括認識する際、単語認識を行なうとともに、その領域に
対し文字切り出しと文字認識も行ない、単語認識結果に
含まれる文字が、上記文字認識結果中に、予め定められ
た上位n位以内に閾値数以上含まれる場合に単語認識結
果を確定することにより、極端な誤読を減らすことがで
きる。 (11)文字特徴を合成することにより生成した単語特
徴を用いて単語領域を一括認識する場合、マッチングし
たテンプレートから単語イメージにおける各文字の分割
位置を算出し、各分割位置で求めた単語イメージの線密
度もしくは周辺分布と、認識した単語の各文字が保持す
る線密度もしくは周辺分布を比較し、両者の線密度、周
辺分布の総和、もしくは、大小比率が閾値以上異なる場
合に単語認識結果をリジェクトすることにより、単語認
識の誤読を減らすことができる。 (12)文字特徴を合成することにより生成した単語特
徴を用いて単語領域を一括認識する場合に、認識した単
語内の文字数と、単語イメージから推定される文字数の
比較を行ない、両者の文字数が閾値以上異なる場合に単
語認識結果をリジェクトすることにより、上記と同様、
単語認識の誤読を減らすことができる。
【図面の簡単な説明】
【図1】本発明の概要を説明する図である。
【図2】本発明の実施例の文字列認識装置の全体の概略
構成を示す図である。
【図3】キー文字コード自動抽出処理、キー文字/キー
単語抽出処理の実施例を示す図である。
【図4】認識対象文字群と抽出される文字、文字列の一
例を示す図である。
【図5】個別文字切り出し、文字認識・キー単語抽出処
理のフローを示す図である。
【図6】個別文字として切り出した文字の単語認識を行
う場合を説明する図である。
【図7】線密度/周辺分布による検証処理を示す図であ
る。
【図8】線密度/周辺分布による検証処理を説明する図
である。
【符号の説明】
1 キー文字コード抽出手段 2 キー単語抽出手段 3 単語認識手段 4 検証手段 11 キー文字コード自動抽出処理 12 キー文字/キー単語抽出処理 13 単語領域抽出処理 14 単語認識処理 15 文字切り出し/文字認識処理 16 線密度/周辺分布による検証処理 17 文字数推定処理
───────────────────────────────────────────────────── フロントページの続き (72)発明者 直井 聡 神奈川県川崎市中原区上小田中4丁目1番 1号 富士通株式会社内 (72)発明者 諏訪 美佐子 神奈川県川崎市中原区上小田中4丁目1番 1号 富士通株式会社内 Fターム(参考) 5B064 AA01 BA01 CA08 DA10 EA19 EA39

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 文字コードで表される認識対象とする文
    字列カテゴリから文字列の節となるキー単語のコード列
    を自動抽出するキー文字コード抽出手段と、 文字列イメージ中から、上記キー文字コード抽出手段に
    より抽出されたキー単語、もしくは、その一部を抽出す
    るキー単語抽出手段と、 抽出されたキー単語により決定される部分領域内の文字
    列に対して一括認識する認識手段と、 一括認識した結果を検証する検証手段とを備えたことを
    特徴とする文字列認識装置。
  2. 【請求項2】 上記キー単語抽出手段は、文字列イメー
    ジ中からキー単語を抽出する際に、キー単語を構成する
    文字のうち、離れた位置の2文字以上が抽出され、その
    文字間に挟まれた領域内の文字のうち、一定の割合以上
    が抽出された場合に、その部分文字列をキー単語の部分
    文字列として抽出することを特徴とする請求項1の文字
    列認識装置。
  3. 【請求項3】 上記キー文字コード抽出手段は、文字列
    カテゴリから文字列の節となるキー単語のコード列を抽
    出する際に、認識対象文字列全体の中で出現頻度の高い
    文字、文字列単位で見たときに出現頻度の高い文字、お
    よび/または、高い相関を持って出現する文字の組をキ
    ー単語として抽出することを特徴とする請求項1の文字
    列認識装置。
  4. 【請求項4】 上記認識手段は、単語領域を一括認識す
    る際、単語認識を行なうとともに、その領域に対し文字
    切り出しと文字認識も行ない、単語認識結果に含まれる
    文字が、上記文字認識結果中に、予め定められた上位n
    位以内に閾値数以上含まれる場合に単語認識結果を確定
    することを特徴とする請求項1の文字列認識装置。
  5. 【請求項5】 文字列イメージを認識するプログラムを
    記録した記録媒体であって、 上記プログラムは、文字コードで表される認識対象とす
    る文字列カテゴリから文字列の節となるキー単語のコー
    ド列を自動抽出し、 文字列イメージ中から、上記抽出されたキー単語、もし
    くは、その一部を抽出し、 抽出されたキー単語により決定される部分領域内の文字
    列に対して一括認識を行い、一括認識した結果を検証す
    ることを特徴とする文字列イメージを認識するプログラ
    ムを記録した記録媒体。
JP2001015349A 2001-01-24 2001-01-24 文字列認識装置 Expired - Fee Related JP4136316B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2001015349A JP4136316B2 (ja) 2001-01-24 2001-01-24 文字列認識装置
US10/020,249 US7136526B2 (en) 2001-01-24 2001-12-18 Character string recognition apparatus, character string recognizing method, and storage medium therefor
CNB021023530A CN100474331C (zh) 2001-01-24 2002-01-23 字符串识别装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001015349A JP4136316B2 (ja) 2001-01-24 2001-01-24 文字列認識装置

Publications (2)

Publication Number Publication Date
JP2002216076A true JP2002216076A (ja) 2002-08-02
JP4136316B2 JP4136316B2 (ja) 2008-08-20

Family

ID=18881913

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001015349A Expired - Fee Related JP4136316B2 (ja) 2001-01-24 2001-01-24 文字列認識装置

Country Status (3)

Country Link
US (1) US7136526B2 (ja)
JP (1) JP4136316B2 (ja)
CN (1) CN100474331C (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008243208A (ja) * 2007-03-27 2008-10-09 Fujitsu Ltd 住所認識装置
JP2011221886A (ja) * 2010-04-13 2011-11-04 Fujitsu Frontech Ltd 帳票認識プログラム、帳票認識装置、および帳票認識方法
CN113837129A (zh) * 2021-09-29 2021-12-24 平安科技(深圳)有限公司 手写签名错别字识别方法、装置、设备及存储介质

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPR824501A0 (en) * 2001-10-15 2001-11-08 Silverbrook Research Pty. Ltd. Methods and systems (npw003)
AUPR824601A0 (en) * 2001-10-15 2001-11-08 Silverbrook Research Pty. Ltd. Methods and system (npw004)
US8245130B1 (en) * 2007-05-31 2012-08-14 Google Inc. Performing an estimation on content to be presented
US20080310721A1 (en) * 2007-06-14 2008-12-18 John Jinhwan Yang Method And Apparatus For Recognizing Characters In A Document Image
JP4898615B2 (ja) * 2007-09-20 2012-03-21 キヤノン株式会社 情報処理装置および符号化方法
CN101571921B (zh) * 2008-04-28 2012-07-25 富士通株式会社 关键字识别方法和装置
CN101430680B (zh) 2008-12-31 2011-01-19 阿里巴巴集团控股有限公司 一种无词边界标记语言文本的分词序列选择方法及系统
CN102402692B (zh) * 2010-09-13 2014-06-04 中国科学院遥感应用研究所 一种特征字符串识别方法及系统
TWI478074B (zh) * 2010-12-01 2015-03-21 Inst Information Industry 文字辨識方法、裝置以及儲存其之電腦可讀取紀錄媒體
US8843493B1 (en) * 2012-09-18 2014-09-23 Narus, Inc. Document fingerprint
WO2014166531A1 (en) * 2013-04-10 2014-10-16 Hewlett-Packard Indigo B.V. Data transfer system, method of transferring data, and system
JP6194781B2 (ja) * 2013-12-11 2017-09-13 富士ゼロックス株式会社 画像処理装置及びプログラム
US9984401B2 (en) * 2014-02-25 2018-05-29 Truecar, Inc. Mobile price check systems, methods and computer program products
JP6707825B2 (ja) * 2015-09-14 2020-06-10 富士ゼロックス株式会社 情報処理装置及びプログラム
JP7234495B2 (ja) * 2018-01-25 2023-03-08 富士フイルムビジネスイノベーション株式会社 画像処理装置及びプログラム
CN113127637A (zh) * 2019-12-31 2021-07-16 中兴通讯股份有限公司 一种字符的还原方法及装置、存储介质、电子装置
CN117312624B (zh) * 2023-11-30 2024-02-20 北京睿企信息科技有限公司 一种获取目标数据列表的数据处理系统

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6338148B1 (en) * 1993-11-10 2002-01-08 Compaq Computer Corporation Real-time test controller
US6246794B1 (en) * 1995-12-13 2001-06-12 Hitachi, Ltd. Method of reading characters and method of reading postal addresses
JP3440793B2 (ja) 1997-12-01 2003-08-25 富士通株式会社 単語認識装置
JP3639126B2 (ja) * 1998-01-22 2005-04-20 富士通株式会社 住所認識装置及び住所認識方法
US6269188B1 (en) * 1998-03-12 2001-07-31 Canon Kabushiki Kaisha Word grouping accuracy value generation
JP3522106B2 (ja) 1998-05-11 2004-04-26 富士通株式会社 文字認識装置
JP3622503B2 (ja) * 1998-05-29 2005-02-23 株式会社日立製作所 特徴文字列抽出方法および装置とこれを用いた類似文書検索方法および装置並びに特徴文字列抽出プログラムを格納した記憶媒体および類似文書検索プログラムを格納した記憶媒体
US6249605B1 (en) * 1998-09-14 2001-06-19 International Business Machines Corporation Key character extraction and lexicon reduction for cursive text recognition
US6539118B1 (en) * 1998-12-31 2003-03-25 International Business Machines Corporation System and method for evaluating character sets of a message containing a plurality of character sets
JP2000353215A (ja) * 1999-06-11 2000-12-19 Nec Corp 文字認識装置および文字認識プログラムを記録した記録媒体

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008243208A (ja) * 2007-03-27 2008-10-09 Fujitsu Ltd 住所認識装置
JP2011221886A (ja) * 2010-04-13 2011-11-04 Fujitsu Frontech Ltd 帳票認識プログラム、帳票認識装置、および帳票認識方法
CN113837129A (zh) * 2021-09-29 2021-12-24 平安科技(深圳)有限公司 手写签名错别字识别方法、装置、设备及存储介质
CN113837129B (zh) * 2021-09-29 2023-10-03 平安科技(深圳)有限公司 手写签名错别字识别方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN100474331C (zh) 2009-04-01
US7136526B2 (en) 2006-11-14
US20020114515A1 (en) 2002-08-22
JP4136316B2 (ja) 2008-08-20
CN1367460A (zh) 2002-09-04

Similar Documents

Publication Publication Date Title
JP2002216076A (ja) 文字列認識装置
US7881536B2 (en) Identifying a string formed from a number of hand-written characters
US7171350B2 (en) Method for named-entity recognition and verification
US8340429B2 (en) Searching document images
CN112560842B (zh) 一种信息识别方法、装置、设备和可读存储介质
Huang et al. Mapping transcripts to handwritten text
Kessentini et al. Word spotting and regular expression detection in handwritten documents
Saiga et al. An OCR system for business cards
US20140093173A1 (en) Classifying a string formed from hand-written characters
US20220044048A1 (en) System and method to recognise characters from an image
JPH11328315A (ja) 文字認識装置
Singh et al. DS theory based fingerprint classifier fusion with update rule to minimize training time
JP3360030B2 (ja) 文字認識装置および文字認識方法および文字認識方法をプログラムの形で記録した記録媒体
Mishra Understanding Text in Scene Images
Slavin et al. Matching Digital Copies of Documents Based on OCR
JP3361258B2 (ja) 文字読取装置
Govindaraju et al. Paradigms in handwriting recognition
JP2985813B2 (ja) 文字列認識装置および知識データベース学習方法
JP3507720B2 (ja) オンライン手書き文字認識装置及びコンピュータ読み取り可能な記録媒体
JPH0256086A (ja) 文字認識の後処理方法
JP3006823B2 (ja) 文字および単語の認識方式
JP2994992B2 (ja) 手書き文字オンライン認識装置とその字体登録・学習方法
JP3130392B2 (ja) 文字認識装置
JP3151866B2 (ja) 英文字認識方法
Hinami et al. Bidirectional extraction and recognition of scene text with layout consistency

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040805

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080311

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080507

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080603

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080603

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110613

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120613

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120613

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130613

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140613

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees