JP2002298085A - 文字認識装置、文字認識方法、及び記録媒体 - Google Patents

文字認識装置、文字認識方法、及び記録媒体

Info

Publication number
JP2002298085A
JP2002298085A JP2001100534A JP2001100534A JP2002298085A JP 2002298085 A JP2002298085 A JP 2002298085A JP 2001100534 A JP2001100534 A JP 2001100534A JP 2001100534 A JP2001100534 A JP 2001100534A JP 2002298085 A JP2002298085 A JP 2002298085A
Authority
JP
Japan
Prior art keywords
character
characters
character recognition
frame
feature vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001100534A
Other languages
English (en)
Other versions
JP4031210B2 (ja
Inventor
Hiroyuki Mizutani
博之 水谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2001100534A priority Critical patent/JP4031210B2/ja
Priority to US10/108,625 priority patent/US7233697B2/en
Publication of JP2002298085A publication Critical patent/JP2002298085A/ja
Application granted granted Critical
Publication of JP4031210B2 publication Critical patent/JP4031210B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】本発明は文字認識枠内に複数の数字が記入され
ても正しく認識できる。 【解決部】枠内に文字画像があるか否か判定し、ある場
合は、特徴ベクトルを入力とする文字数判別関数の関数
値と所定の閾値との大小関係に基づいて文字数を判別し
(16)、判別結果に基づいて文字を切り出し(1
8)、認識する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は所定の用紙(以下、
帳票と称する)に記入された文字を認識する文字認識装
置、文字認識方法、及び記録媒体に関する。
【0002】
【従来の技術】光学的文字認識装置(以下、OCRと略
称する)では入力専用のドロップアウトカラー帳票や多
くの既存帳票を読み取るもので、OCR入力の効率化を
図るために、1文字毎に文字枠を設け、利用者に文字枠
内に文字を記入させることにより、近接する文字同士の
干渉を避けることができるように帳票を設計することが
多かった。このような帳票に対してOCR読み取りアル
ゴリズムを設計する場合、読み取り仕様としては、各文
字枠内には文字が記入されていない場合、あるいは1文
字が記入されている場合の2つの場合のみを想定してい
る。そのため、1文字枠に2文字以上の文字が記入され
ている場合は仕様外であり、正しい読み取りを行うこと
は原理的に不可能であった。
【0003】例えば、特開平8−212301号公報記
載の文字ピッチ情報や文字ストローク情報を用いた文字
数推定方法では、このような仕様の帳票に対しては、1
文字枠に1文字が記載された帳票仕様どおりの記入文字
に対しては文字ピッチを求めることはしないし、1文字
枠に2文字が記載され、これら2文字に接触がない場合
には、文字ストローク情報を使った文字数推定を行うこ
ともできない。
【0004】また、特開2000−339408号公報
に記載されたペリフェラル情報と文字枠情報とを組み合
わせて文字数推定を行う方法も、1文字枠に複数文字が
記入された場合には適用は困難である。
【0005】
【発明が解決しようとする課題】このように従来の文字
認識装置では、1文字毎に文字枠を設けた帳票を使用す
ることを前提として認識アルゴリズムを設計しており、
1文字枠に2文字以上の文字が記入されている場合は仕
様外として正しく認識できなかった。
【0006】本発明は1文字枠内に複数文字が記入され
ている場合でも、正しく認識可能な文字認識装置、文字
認識方法、及び記録媒体を提供することを目的とする。
【0007】
【課題を解決するための手段】上記した課題を解決し目
的を達成するために、本発明は以下に示す手段を用いて
いる。
【0008】(1)文字認識枠が設けられた帳票の文字
を認識する文字認識装置は、1つの文字認識枠に記入さ
れている文字数を判定する手段と、前記文字認識枠の文
字画像から判定手段の判定結果に基づいた字数の文字を
切り出して認識する手段とを具備するものである。
【0009】(2)文字認識枠が設けられた帳票の文字
を認識する文字認識方法は、帳票の文字画像を入力し、
1つの文字認識枠内の文字画像の特徴ベクトルを求め、
前記特徴ベクトルに基づいて1つの文字認識枠内の文字
数を判定し、判定した文字数に基づいて前記文字認識枠
内の文字画像から文字を切り出し、切り出した文字を特
徴ベクトルを用いて文字を認識するものである。
【0010】(3)文字認識枠が設けられた帳票の文字
を認識する文字認識プログラムを記憶するコンピュータ
読み取り可能な記録媒体において、文字認識プログラム
は、コンピュータに、1つの文字認識枠に記入されてい
る文字数を判定させる機能と、前記文字認識枠の文字画
像から判定手段の判定結果に基づいた字数の文字を切り
出して認識させる機能とを実現させるものである。
【0011】
【発明の実施の形態】以下、図面を参照して本発明によ
る文字認識装置、文字認識方法、及び記録媒体の実施形
態を説明する。
【0012】図1は、本発明の第1実施形態に係る文字
認識装置の構成を示す図である。
【0013】入力部10は、スキャナやデジタルカメラ
等からなり、帳票上の文字の濃淡を電子信号に変換し、
文字画像を得る。
【0014】前処理部12は入力部10により入力され
た文字画像に対して、2値化、エッジ検出、ノイズ除
去、ラベル画像生成等の画像処理を行う。
【0015】フォーマット処理部14は前処理部12で
処理された文字画像に対して、帳票フォーマットの解析
を行い、帳票上の文字認識枠が形成されている読み取り
フィールドの位置を決定する。読み取りフィールドの位
置が決まると、文字数判定部16により読み取りフィー
ルドの文字枠中の文字数を判定し、判定された文字数の
情報を基に文字切り出し部18により1文字毎の文字画
像を切り出す。切り出しは種々の手法があるが、例えば
黒画素の連結成分の外接矩形を用いて文字を切り出す手
法、射影を使って文字を切り出す手法がある。
【0016】文字切り出し部18から出力された1文字
毎の文字画像は文字認識部20に供給され、文字画像の
特徴ベクトルが抽出される。文字認識部20は得られた
特徴ベクトルと予め用意されている各文字の特徴ベクト
ルを記憶する辞書(図示せず)との比較を行い、候補文
字を決定(文字認識)する。ここでは、文字認識枠を例
えば10×10の画素に分割し、その画素の濃淡パター
ンを特徴ベクトルとし、辞書データの特徴ベクトルとの
内積を求めてどの文字かを認識する。後処理部22では
文字認識結果の編集や訂正を行う。出力部24では出力
媒体に応じた認識結果のフォーマット変換やデータ変換
を行う。
【0017】図2は、本実施形態が読み取り対象として
いる帳票の例を示す。この帳票例は通信販売の商品の注
文票であり、各商品名の後に個数を記入する枠(読み取
りフィールド)が設けられ、各読み取りフィールドには
1文字(1数字)が記入されることを意図して帳票設計
がされている。しかし、3番目の品名:チーズの項目で
は1枠内に“12”と2文字が記入されており、本帳票
の仕様外の記入になっている。しかし、本実施形態では
このように1読み取りフィールドの文字枠中に2文字が
記入されている帳票も認識可能である。これを実現する
ために、本実施形態では文字切り出し手段18の前に文
字数判定部16が設けられ、1フィールド内に何文字記
入されているかが判断され、この判断結果に基づいてフ
ィールドから文字が切り出される。こうして切り出され
た文字を認識することにより、文字枠内に2文字が記入
されたとしても、読み取り不能とするのではなく、認識
した2文字を出力する。
【0018】図3は、文字数判定部16の動作概要を示
す流れ図である。前処理、及びフォーマット処理後の文
字画像が入力されると(ステップS10)、ステップS
12で文字画像内に読み取りフィールド(例えば、読み
取り行毎に文字の記入の有無を示す数字又は記号が記
入)が存在するか否か判断される。無い場合は、処理が
終了する。読み取りフィールドがある場合は、ステップ
S14で1つの読み取りフィールドが指定され、ステッ
プS16でその文字枠中に文字画像があるか否か判断さ
れる。文字枠中に文字画像が無い場合は、ステップS1
8で文字数は0とされ、ステップS32で全部の読み取
りフィールドについての処理が終了したか否か判定され
る。全部の読み取りフィールドについての処理が終了す
ると、処理が終了する。未処理の読み取りフィールドが
残っている場合は、ステップS34で次の読み取りフィ
ールドが指定され、ステップS16の処理(読み取りフ
ィールドの文字枠中に文字画像があるか否かの判定)が
繰り返される。
【0019】ステップS16で読み取りフィールドの文
字枠中に文字画像があると判定された場合は、ステップ
S20で文字数の仮定数を示す変数nに1をセットす
る。ステップS22で、変数nが上限値N以下であるか
否か判定する。上限値Nに達した場合は、ステップS2
4で文字数は不定(判定不可能)とし、ステップS32
へ進み、全部の読み取りフィールドについての処理が終
了したか否か判定される。
【0020】変数nが上限値N以下である場合は、ステ
ップS26で読み取りフィールドの文字枠中の文字数が
nであると仮定し、この仮定が正しいか否かを判定す
る。この判定は種々の方法があるが、ここでは、文字画
像の特徴ベクトルの関数であるn文字判別関数を用い
て、その関数値と閾値との大小関係により仮定が正しい
か否か判定する(詳細は図4に示す)。文字数がnであ
るという仮定が妥当であると判断された場合は、ステッ
プS28で文字数はnとされ、ステップS32へ進み、
全部の読み取りフィールドについての処理が終了したか
否か判定される。
【0021】ステップS26で読み取りフィールドの文
字枠中の文字数がnであるという仮定が妥当ではないと
判断された場合は、ステップS30でnが+1され、ス
テップS22に戻る。
【0022】このように本実施形態では読み取りフィー
ルドの文字枠中に文字画像があると判断された場合は、
1文字判別関数、2文字判別関数、…(N−1)文字判
別関数を順次用いて文字数を判定し、(N−1)文字判
別関数を用いても判定不能の場合は文字数を未定とす
る。
【0023】次に、n文字判別関数を用いる判別動作
(図3のステップS26)について説明する。図4はn
=1の場合、すなわち文字数が1文字か否(複数文字)
かの判別を行う1文字判別関数を用いた判別動作を示す
流れ図である。
【0024】前処理、及びフォーマット処理後の読み取
りフィールドの文字枠中の文字画像が入力されると(ス
テップS40)、ステップS42で文字画像から予め定
められた特徴抽出アルゴリズムにより文字特徴の抽出を
行い、特徴ベクトルを生成する。ステップS44で、こ
の特徴ベクトルを入力とした1文字判別関数の値を計算
する。ステップS46で、この関数値が予め定められた
閾値より大きいか否かを判定し、大きければステップS
48で文字数1という仮定が妥当であるとの判断を行
う。一方、この関数値が閾値よりも大きくなければ、1
文字と仮定したことは間違いであり、すなわち、文字数
は複数文字であると判断する。なお、関数値と閾値との
大小関係を比較する場合、本実施形態では閾値より大き
い場合はn文字の仮定が正しいとし、大きくない場合は
仮定が間違いであるとしたが、判別関数の定義に応じて
これらの大小関係は入れ代えることができる。
【0025】同様に、n文字判別関数の場合も、関数値
が閾値より大きい場合はn文字であり、関数値が閾値よ
りも大きくなければ、文字数はnではない、すなわち、
(n+1)文字以上であるとする。
【0026】次に、n文字判別関数の構成方法について
説明する。例としては、n=1の場合を説明する。ま
ず、1つの読み取りフィールドの文字枠中に1文字が記
入されている文字画像サンプルと2文字以上が記入され
ている文字画像サンプルとを多数用意する。これらの文
字画像サンプルに対して文字数判定部16で用いられる
特徴抽出アルゴリズムと同じ特徴抽出アルゴリズムによ
り各フィールドの特徴ベクトルを生成する。各フィール
ドの特徴ベクトルに対して、文字数が1文字か複数文字
かに応じて符号を与える。たとえば1文字の場合は特徴
ベクトルに対して+1、複数文字の場合は−1の符号を
与える。全てのサンプルの全てのフィールドの特徴ベク
トルに対して、特徴ベクトルを入力とし、符号を出力と
するような1文字判別関数を決定する。この決定は、図
5に示すように、最小二乗法や回帰分析により回帰関数
を求めることにより容易に決定できる。図5の判別関数
の場合、閾値を0とすれば、判別関数の値が正ならば文
字画像は1文字であると判断し、負であれば2文字以上
であると判断できる。
【0027】判別関数の別の構成法としては、1文字お
よび複数文字各々について特徴ベクトルの分布を正規分
布としたパラメトリックな判別法を用いることもでき
る。図6に示すように、これら2つの分布の平均と分散
を予め求めておいて、各々の分布と未知特徴ベクトル
(ここでは、特徴ベクトルは2次元ベクトルであるとす
る)とのマハラノビス距離を計算し、距離が近い方に判
別を行えばよい。
【0028】以上の例ではn=1の場合についてのn文
字判別関数の構成法を説明したが、n>1の場合も同様
にして判別関数を構成することができる。
【0029】以上説明したように、第1実施形態によれ
ば、帳票の文字枠内の文字数を判定し、判定結果に基づ
いて文字を切り出して認識するので、1文字枠に2文字
以上の文字が記入されている場合でも正しく認識でき
る。また、文字数判定は認識に使う特徴ベクトルと同じ
ものを用いているので、高速に判定できるとともに、認
識の際に特徴ベクトルを求める必要が無いので、全体の
処理を短時間に行うことができる。さらに、文字数判定
は文字数nを1から順次増やしていって、n文字である
か否かだけを判定するので、高速に判定ができる。
【0030】変形例 本発明は上述した実施形態に限定されず、種々変形して
実施可能である。例えば、上述の説明では、文字認識枠
内には数字が記載されているが、これに限らず、仮名、
漢字、記号等でも良い。
【0031】なお、本願発明は上記実施形態に限定され
るものではなく、実施段階ではその趣旨を逸脱しない範
囲で種々に変形することが可能である。また、各実施形
態は可能な限り適宜組み合わせて実施してもよく、その
場合組合わせた効果が得られる。さらに、上記実施形態
には種々の段階の発明が含まれており、開示される複数
の構成要件における適宜な組合わせにより種々の発明が
抽出され得る。例えば、実施形態に示される全構成要件
から幾つかの構成要件が削除されても、発明が解決しよ
うとする課題の欄で述べた課題が解決でき、発明の効果
の欄で述べられている効果が得られる場合には、この構
成要件が削除された構成が発明として抽出され得る。
【0032】
【発明の効果】以上説明したように本発明によれば、1
文字枠内に複数文字が記入されている場合でも、文字数
判定に従い文字認識が正しく実行することができる。ま
た、文字数判定は認識に使う特徴ベクトルを使用する
為、文字数判定に特別な処理時間を費やすことなく実行
できる。
【図面の簡単な説明】
【図1】本発明による文字認識装置の第1の実施形態の
構成を示すブロック図。
【図2】第1の実施形態で想定している帳票の一例を示
す図。
【図3】第1の実施形態の動作を示すフローチャート。
【図4】第1の実施形態の1文字判別を示すフローチャ
ート。
【図5】回帰関数からなる文字数判別関数の一例を示す
図。
【図6】特徴ベクトルの分布とのマハラノビス距離に基
づく判別関数の一例を示す図。
【符号の説明】
12…前処理部 14…フォーマット処理部 16…文字数判定部 18…文字切り出し部 20…文字認識部

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 文字認識枠が設けられた帳票の文字を認
    識する文字認識装置において、 1つの文字認識枠に記入されている文字数を判定する手
    段と、 前記文字認識枠の文字画像から前記判定手段の判定結果
    に基づいた字数の文字を切り出して認識する手段と、 を具備することを特徴とする文字認識装置。
  2. 【請求項2】 前記判定手段は前記文字認識枠の文字画
    像の特徴ベクトルを求める手段と、前記特徴ベクトルを
    入力とする文字数判別関数を用いて文字数を判定する手
    段と、を具備し、 前記認識手段は前記特徴ベクトルを用いて文字を認識す
    ることを特徴とする請求項1に記載の文字認識装置。
  3. 【請求項3】 前記文字数判別関数は文字数がn(nは
    任意の整数)の場合は第1の関数値、nでは無い場合は
    第2の関数値をとるn文字判別関数であることを特徴と
    する請求項2に記載の文字認識装置。
  4. 【請求項4】 前記判定手段は前記文字認識枠の文字画
    像の特徴ベクトルの分布を求める手段と、予め求めてお
    いた文字数がn(nは任意の整数)の場合の特徴ベクト
    ルの分布と、nでは無い場合の特徴ベクトルの分布との
    距離に基づいてn文字であるか否かを判定する手段と、
    を具備することを特徴とする請求項1に記載の文字認識
    装置。
  5. 【請求項5】 文字認識枠が設けられた帳票の文字を認
    識する文字認識方法において、 帳票の文字画像を入力し、 1つの文字認識枠内の文字画像の特徴ベクトルを求め、 前記特徴ベクトルに基づいて1つの文字認識枠内の文字
    数を判定し、 判定した文字数に基づいて前記文字認識枠内の文字画像
    から文字を切り出し、 切り出した文字を前記特徴ベクトルを用いて認識するこ
    とを特徴とする文字認識方法。
  6. 【請求項6】 前記文字数の判定は、 1文字であるか否かを判定し、 否であると判定された場合は、上限まで順次文字数を増
    やして、同様な判定を行なうことを特徴とする請求項5
    記載の文字認識方法。
  7. 【請求項7】 文字認識枠が設けられた帳票の文字を認
    識する文字認識プログラムを記憶するコンピュータ読み
    取り可能な記録媒体において、前記文字認識プログラム
    は、コンピュータに、 1つの文字認識枠に記入されている文字数を判定させる
    機能と、 前記文字認識枠の文字画像から前記判定手段の判定結果
    に基づいた字数の文字を切り出して認識させる機能と、 を実現させるためのプログラムであることを特徴とする
    記録媒体。
JP2001100534A 2001-03-30 2001-03-30 文字認識装置、文字認識方法、及び記録媒体 Expired - Lifetime JP4031210B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2001100534A JP4031210B2 (ja) 2001-03-30 2001-03-30 文字認識装置、文字認識方法、及び記録媒体
US10/108,625 US7233697B2 (en) 2001-03-30 2002-03-29 Character recognition device and a method therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001100534A JP4031210B2 (ja) 2001-03-30 2001-03-30 文字認識装置、文字認識方法、及び記録媒体

Publications (2)

Publication Number Publication Date
JP2002298085A true JP2002298085A (ja) 2002-10-11
JP4031210B2 JP4031210B2 (ja) 2008-01-09

Family

ID=18953970

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001100534A Expired - Lifetime JP4031210B2 (ja) 2001-03-30 2001-03-30 文字認識装置、文字認識方法、及び記録媒体

Country Status (2)

Country Link
US (1) US7233697B2 (ja)
JP (1) JP4031210B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100356390C (zh) * 2004-09-24 2007-12-19 北京中星微电子有限公司 一种显示操作终端进行光符识别的方法

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050097046A1 (en) 2003-10-30 2005-05-05 Singfield Joy S. Wireless electronic check deposit scanning and cashing machine with web-based online account cash management computer application system
US7655331B2 (en) 2003-12-01 2010-02-02 Societe Bic Fuel cell supply including information storage device and control system
US7642742B2 (en) * 2003-12-01 2010-01-05 Societe Bic Fuel cell system with fuel supply monitoring system and method of use
JP4756930B2 (ja) * 2005-06-23 2011-08-24 キヤノン株式会社 ドキュメント管理システム、ドキュメント管理方法、画像形成装置および情報処理装置
US8708227B1 (en) 2006-10-31 2014-04-29 United Services Automobile Association (Usaa) Systems and methods for remote deposit of checks
US7873200B1 (en) 2006-10-31 2011-01-18 United Services Automobile Association (Usaa) Systems and methods for remote deposit of checks
US9058512B1 (en) 2007-09-28 2015-06-16 United Services Automobile Association (Usaa) Systems and methods for digital signature detection
US9159101B1 (en) 2007-10-23 2015-10-13 United Services Automobile Association (Usaa) Image processing
US10380562B1 (en) 2008-02-07 2019-08-13 United Services Automobile Association (Usaa) Systems and methods for mobile deposit of negotiable instruments
US10504185B1 (en) 2008-09-08 2019-12-10 United Services Automobile Association (Usaa) Systems and methods for live video financial deposit
US8452689B1 (en) 2009-02-18 2013-05-28 United Services Automobile Association (Usaa) Systems and methods of check detection
US10956728B1 (en) 2009-03-04 2021-03-23 United Services Automobile Association (Usaa) Systems and methods of check processing with background removal
CN102741688B (zh) 2009-07-27 2015-06-17 梅索磅秤技术有限公司 化验信息管理方法和设备
US9779392B1 (en) 2009-08-19 2017-10-03 United Services Automobile Association (Usaa) Apparatuses, methods and systems for a publishing and subscribing platform of depositing negotiable instruments
US8977571B1 (en) 2009-08-21 2015-03-10 United Services Automobile Association (Usaa) Systems and methods for image monitoring of check during mobile deposit
US9129340B1 (en) 2010-06-08 2015-09-08 United Services Automobile Association (Usaa) Apparatuses, methods and systems for remote deposit capture with enhanced image detection
US10380565B1 (en) 2012-01-05 2019-08-13 United Services Automobile Association (Usaa) System and method for storefront bank deposits
JP6115388B2 (ja) * 2013-08-01 2017-04-19 株式会社デンソー ナンバープレート認識装置およびナンバープレート認識方法
US9286514B1 (en) 2013-10-17 2016-03-15 United Services Automobile Association (Usaa) Character count determination for a digital image
US9361536B1 (en) * 2014-12-16 2016-06-07 Xerox Corporation Identifying user marks using patterned lines on pre-printed forms
US10506281B1 (en) 2015-12-22 2019-12-10 United Services Automobile Association (Usaa) System and method for capturing audio or video data
US11030752B1 (en) 2018-04-27 2021-06-08 United Services Automobile Association (Usaa) System, computing device, and method for document detection
CN109271973A (zh) * 2018-11-09 2019-01-25 天津新开心生活科技有限公司 医学文本ocr方法及系统
WO2020098078A1 (zh) * 2018-11-12 2020-05-22 平安科技(深圳)有限公司 Ocr训练样本的生成方法、装置、设备及可读存储介质
US11900755B1 (en) 2020-11-30 2024-02-13 United Services Automobile Association (Usaa) System, computing device, and method for document detection and deposit processing

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6330358B1 (en) * 1993-01-14 2001-12-11 Atr Auditory And Visual Perception Research Laboratories Apparatus for character segmentation and apparatus for character recognition using the same
JPH08212301A (ja) 1995-02-07 1996-08-20 Sanyo Electric Co Ltd 文字切出装置及びその切出方法
US5689585A (en) * 1995-04-28 1997-11-18 Xerox Corporation Method for aligning a text image to a transcription of the image
JPH0954813A (ja) 1995-08-11 1997-02-25 Fujitsu Ltd 文字切り出し装置
US5881172A (en) * 1996-12-09 1999-03-09 Mitek Systems, Inc. Hierarchical character recognition system
JP2000339408A (ja) 1999-05-26 2000-12-08 Matsushita Electric Ind Co Ltd 文字切り出し装置
JP2000353215A (ja) * 1999-06-11 2000-12-19 Nec Corp 文字認識装置および文字認識プログラムを記録した記録媒体
JP3480404B2 (ja) * 1999-12-22 2003-12-22 日本電気株式会社 単語大分類装置及びその単語大分類方法並びにその制御プログラムを記録した記録媒体
US6826305B2 (en) * 2001-03-27 2004-11-30 Ncr Corporation Methods and apparatus for locating and identifying text labels in digital images

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100356390C (zh) * 2004-09-24 2007-12-19 北京中星微电子有限公司 一种显示操作终端进行光符识别的方法

Also Published As

Publication number Publication date
JP4031210B2 (ja) 2008-01-09
US7233697B2 (en) 2007-06-19
US20020154815A1 (en) 2002-10-24

Similar Documents

Publication Publication Date Title
JP2002298085A (ja) 文字認識装置、文字認識方法、及び記録媒体
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
US7970213B1 (en) Method and system for improving the recognition of text in an image
JPH04225485A (ja) バーコードを認識する方法
US7796817B2 (en) Character recognition method, character recognition device, and computer product
JP4159720B2 (ja) 表認識方法と表認識装置と文字認識装置及び表認識プログラムを記録した記憶媒体
CN111460355A (zh) 一种页面解析方法和装置
JP2000207489A (ja) 文字抽出方法、装置および記録媒体
Kumar et al. NESP: Nonlinear enhancement and selection of plane for optimal segmentation and recognition of scene word images
JP4049560B2 (ja) 網点除去方法及びシステム
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
US6983071B2 (en) Character segmentation device, character segmentation method used thereby, and program therefor
JP5291387B2 (ja) ナンバー認識装置およびナンバー認識方法
Hesham et al. A zone classification approach for arabic documents using hybrid features
JP3466449B2 (ja) パターン認識方法および装置とパターン認識方法をコンピュータに実行させるためのプログラムを記録した記録媒体
JP3113769B2 (ja) 文字認識装置
Aparna et al. A complete OCR system development of Tamil magazine documents
JP4162195B2 (ja) 画像処理装置、及び画像処理プログラム
JP3163698B2 (ja) 文字認識方法
JP2003317107A (ja) 罫線抽出方法及び装置
JP3753354B2 (ja) 破線識別装置および記録媒体
JP3756660B2 (ja) 画像認識方法、装置および記録媒体
JPH10154191A (ja) 帳票識別方法及び装置並びに帳票識別プログラムを記録した媒体
JP2002279345A (ja) 画像処理装置、画像処理方法及び該方法を実行するためのプログラムを格納したコンピュータ読み取り可能な記憶媒体
JP3517077B2 (ja) パターン抽出装置及びパターン領域の切り出し方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040915

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070628

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070703

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070903

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071016

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071018

R151 Written notification of patent or utility model registration

Ref document number: 4031210

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101026

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111026

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111026

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121026

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121026

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131026

Year of fee payment: 6

EXPY Cancellation because of completion of term