JPH01112388A - 文字認識処理方法 - Google Patents

文字認識処理方法

Info

Publication number
JPH01112388A
JPH01112388A JP62270013A JP27001387A JPH01112388A JP H01112388 A JPH01112388 A JP H01112388A JP 62270013 A JP62270013 A JP 62270013A JP 27001387 A JP27001387 A JP 27001387A JP H01112388 A JPH01112388 A JP H01112388A
Authority
JP
Japan
Prior art keywords
character
image
recognition
vertical projection
width
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62270013A
Other languages
English (en)
Inventor
Masahiro Nakamura
昌弘 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP62270013A priority Critical patent/JPH01112388A/ja
Priority to US07/259,134 priority patent/US5033097A/en
Publication of JPH01112388A publication Critical patent/JPH01112388A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔技術分野〕 本発明は、文字認識装置iqにおいて、不定ピッチ原稿
の文字9j出しおよび認識を行うための文字認識処理方
法に関する。
〔従来技術〕
一般にOCRにおいては、原稿の読取りll!ll像か
ら水平射影によって文字行のイメージを切出し、この文
字行イメージから文字のピッチを用いて文字切出しを行
うようになっている。
しかし、このようなピッチを用いて文字切出しを行う方
法であると、第11図に示すr4686Jのように1ピ
ツチ内に2以上の文字が入った文字列や、第12図に示
す右端の「北」のように−づの文字が二つのピッチにま
たがった文字列などでは、適切な文字切出しを行うこと
ができない。その結果、従来は名刺や雑誌のような不定
ピッチ原稿の認識率が低下し、また文字uj識表装置読
取り対象となり得る原稿の範囲が制限されるという問題
があった。
〔目 的〕
本発明の「1的は、不定ピッチのJJI稿の場合でも、
適切に文字切出しを行って、配゛6い認識率を達成する
ことができる文字認識処理方法を提供することにある。
〔構 成〕
上記目的を達)戊するためになされた本発明の文字認識
処理方法は、原稿の読取り画像の文字行イメージをψj
出し、該文字行イメージの垂直射影を抽出し、文字切出
しおよび認識の処理範囲内における該垂直射影の黒領域
および白領域の幅に応じて該処理範囲内での文字切出し
位置の推定方法を選択し、該選択した推定方法により推
定した文字切出し位置にて該処理範囲内の一つま゛たは
複数の黒領域に対応したイメージを該文字行イメージよ
り切出して認識し、その認識結果に応じ″て最終的な文
字切出し位置を決定し、該最終的な文字切出し位置にて
切出したイメージの認識結果を最終的な認識結果とする
ことを特徴とするものである。
〔実施例〕 以下、図面により本発明の一実施例について説明する。
第1図は本発明により文字認識処理を実行するための装
置構成の一実施例を示す。■は各部の制御およびデータ
処理を実行するCPU、2はC1)Ulを制御するため
のプログラムやデータを格納するための主記憶装置であ
る。
3は行切出し回路、4は行バッファである。行切出し回
路3は、外部から入力した原稿の2値画像データの水平
射影を抽出し、その白領域によって区画された各黒領域
の範囲を文字行として切出し1文字行イメージを行バッ
ファ4に格納するものである。
5は垂直射影抽出回路、6は垂直射影バッファである。
垂直射影抽出回路5は、行バツフア4内の文字行イメー
ジの文字行と垂直方向の射影を抽出し、抽出した垂直射
影データを垂直射影バッファ6に格納するものである。
この垂直射影のデータは、垂直方向に並んだ画素の単純
な論理和データでもよいし、垂直方向に4pんだ黒画素
数をカウントし、黒画素数が特定値を越える部分を黒と
し、黒画素数が特定値未満の部分を白としたデータでも
よい。
7はCI”’Ulにより行バッファ4から切出されたイ
メージの特徴を抽出する特徴抽出回路、8は認識辞書を
格納した辞書メモリである。9は特徴抽出回路7により
抽出された特徴とlII?書メモヅメモリ8辞書の特徴
とのマッチンク処理を行うマツチンク回路、10はバス
である。
第2図は文字行イメージの切出し後の処理の概略を示す
フローチャー1・である。以下、処理内容を順に説明す
る。
行切出し回路3による文字t−jの切出しが終了すると
、CP U 、Lは(主記憶装置2に格納された処理プ
ログラム)は、垂直射影抽出回路5を起動し、行バツフ
ア4内の文字行イメージの垂直射影を抽出させる(ステ
ップ21)。この抽出が終了とすると、CPUIは垂直
射影バッファ6内の垂直射影データを先頭より順次調べ
、最初の黒領域が見つかるまで白領域をスキップする(
ステップ22)。
Cr’Ulは最初の黒領域の開始アドレスを主記憶装置
2に格納し、その黒ツ「【域の幅をカウントする(ステ
ップ23)。この幅と主記憶装置2に格納されている文
字幅(初めはゼロとなっている)との和とピッチとの大
小を比較する(ステップ24)。なお、ピッチは予め与
えておくか、または文字行の高さなどから算出する。
文字幅がピッチより小さい場合、当該黒領域の終了アド
レスと幅を主記憶装置2に格納し、また当該幅と主記憶
装置2に格納されている文字幅との和を改めて文字幅と
して格納する(ステップ25)。次に当該黒領域と次の
黒領域の間の白領域の幅をカウントし、その幅をキ記憶
装置2に格納すると共に、この幅を″i′E記憶装置1
゛′t、2に格納されている文字幅と加算し、その和を
改めて文字幅として格納する(ステップ26)。そして
、ステップ23に戻り処理を続行する。
ステップ24において文字幅がピッチ以」二であると判
定されるまで、ステップ23からステップ26のループ
が繰返され、ステップ24で文字幅がピッチ以上である
と判定されるとループを抜は出してステップ27に進む
ステップ27において、処理すべき黒領域が1個である
か否かを判定する(ステップ27)。黒領域数が1個の
場合、当該黒領域をそのま\一つの文字として切出すこ
とができる場合であるので、当該黒餡j或の開始アドレ
スから終了アドレスまでを切出し候補として、そのアド
レスを出力記憶装置i’j2に記憶し、かつ主記憶装置
2」二の制御フラグを0に設定する(ステップ28)。
黒領域が2個以上の場合、ステップ29の処理に進み、
次の条件1.1+、Illが成立するか否かを調へる。
条件I 注+=+ピッチ内の黒領域の幅が黒餡域幅閾値T HB
より小さく、かつ当該黒領域に続く白領域の幅が白餡域
幅閾値THWより小さい。
例えば、垂直射影が第3図の(イ)または(ロ)に示す
ようであったとすると、黒領域幅bw (i)<TI(
Bかつ白領域幅W (i)<THWの条件の成立性を調
べる。(イ)の場合は条件Iを満足する。具体的には、
例えば漢字の「川」の場合などであり、この場合はピッ
チ内の全黒領域を一つの文字として切出すべきである。
他方、 (ロ)の場合はw (i)がT HWより大き
く、条件■を満足しない。具体的には、例えばミコ1を
番号のように、詰めて印刷した数字列r6111J中の
2文字「11」なとの場合であり、各黒領域をそれぞれ
別々の文字として白領域の部分で切出すべきである。
逢+l−11 注目ピッチ内で黒領域の幅がT H8以上、かつ、その
黒領域の前方の白領域の幅がTHB以上、かつ当該黒領
域以前に条件lを満足する黒領域が存在していて切出し
位置が決定していない(現在の注口ピッチの前の1以上
のピッチについても切出し1文字認識が完了しておらず
、2ピツチ以上に渡って処理している)。
例えば第4図のような垂直射影の場合、注目黒領域幅b
w (i)≧T HBかつ白領域幅w(i−1)≧T 
HBであれば、当該注目黒領域以前に条件Iを満足する
黒領域であって、切出し位置が決定していないと、条件
■が成立する。
これは具体的には、例えば第5図に示す文字列r Jl
l−1−Jの場合などである。この場合、図示のように
注目ピッチ内の「上」は一つの文字として切出し、残り
の部分は前ピッチの部分と一緒に「川」と切出すべきで
ある。
財」!− メl:riピッチ内の白領域の幅がI” )I W以上
、かつ条件1を満足する黒領域か存在し切出し位11“
tが決定していない(2ピツチ以上に渡って処理してい
る)。
例えは第6図のような垂直射影の場合、W(])≧TH
Wで、かつ、残りの条件を満足するならば、条件1■は
成立したことになる。
これは具体的には1例えは第7図に示す文字列のような
場合である。この場合、注目ピッチ内で「(」とr代」
を分離すべきである。
ステップ29の処理の次の判定ステップ30に才)いて
、条件!だけが成立し、残りの条件■およびIIIが成
立しない場合であるかがFJI定され、その判定条件が
成立した場合には1文字切出しおよび文字認識の処理に
は進まず、ステップ23からステップ26のループの処
理に戻る。この場合、文字幅は改めてゼロからカウント
シ、前回のピッチに含まれた最後の白領域の次の黒領域
より次のピッチと考える。そして、再びループを抜は出
た時には、現在の注目ピッチだけでなく、文字切出し、
認識が終了していない前のピッチもステップ29以降の
処理の対象となる。
ステップ30でステップ23に戻る条件は成立しないと
判定された場合、現在の21E l−1ピツチだけの1
ピツチ以内の処理であるか否かを判定する(ステップ3
1)。■ピッチ以内の処理であれば。
最初の黒領域の開始アドレスから、それ以降の最も広い
白領域の直重の黒領域の終了アドレスまでを切出し第1
候補とし、その71−レスを主記憶装置2に記憶し、制
御フラグを1に設定する(ステップ32)。2ピツチ以
」−に渡った処理の場合、制御フラグを2に設定する(
ステップ;33)。
以上のようにして制御フラグか設定された後、制御フラ
グの状態に応じてステップ34,35゜36のいずれか
を実行する。
まずステップ28によって制御フラグがOに設定された
場合、ステップ34を実行する。こシでは、切出し候補
は一つであるから、CPUIは切出し候補の開始アドレ
スから終了アドレスまでのイメージを行バッファ4より
切出し、このイメージを特徴抽出回路7に転送して起動
する。特徴抽出回路7は入力されたイメージの特徴抽出
を行い、抽出した特徴をマツチング回路9に転送する。
CPUIは特徴抽出の終了を通知されると、マツチング
回路9を起動する。マツチング回路9は辞書メモリ8よ
り辞書内容を順次読込み、入力イメージの特徴とのマツ
チングを実行して候補文字を決定する。この候補文字の
コードはCPULの制御により主記憶装置2上の出力バ
ッファに格納される。
例えば第8図に示すような文字列の場合、制御フラグは
0となり、ステップ34により図示のように各文字が切
出され、認識される。
ステップ32によって制御フラグが1に設定された場合
、すなわち1ピッチ以内の処理の場合。
ステップ35を実行する。こ\では、切出し第1候補の
開始、終了アドレスの範囲のイメージを行バッファ4よ
り切出し、特徴抽出、文字認識を順次行わせる。候補文
字は例えば第1候補と第2候補が決定され、それぞれの
コートと認識距離が主記憶装置2の特定アドレスに格納
される。CPU1は第1候補文字の認識確度が規定値よ
り高ければ、切出しと文字認識を終了し、認識した文字
コードを主記憶装置2の出力バッファに格納する。
なお、認識確度としては例えば、第1候補文字の認#a
距離とか、第1候補の認?a距離および第1候補文字と
第2候補文字との認識′に@の差を組合せたようなもの
を使用することができる。
切出し第1候補の位置にて切出された文字(第1候補文
字)の認識確度が規定値より低い場合、黒領域数をkと
すると、最初の黒領域に対応するイメージを一つ目の文
字として切出し、残りの(k−1)個の黒領域のイメー
ジを二つ目の文字として切出し、それぞれ認識を行う。
次に前側の2個の黒領域に対応するイメージと、残りの
(k−2)個の黒領域に対応するイメージとをそれぞれ
一つの文字として切出し、認識を11う。同様にして、
k個の黒領域を2分し、それぞれのイメージを切出し認
識する。最後に前側の(k−1)個の黒領域と残りの1
個の黒領域に2分して切出し認識を行う。
このような2分割切出しと認識の結果、認識確度の最も
高い文字と、それと組みになった文字の両方の認識確度
か、切出し第1候補により切出し認識した文字の認識確
度を上回る場合、当該組みになった2文字を認識結果と
して出力バッファに格納する。そうでない場合には、切
出し第1候補により切出され認識された文字を認識結果
とし、その文字コードを出力バッファに格納する。
具体例を第9図に示す。この図の(イ)の例では、w 
(1) <w (2)であるので第1候補は「北」とな
る。「北」の認識確度が規定値より高い場合は[北」で
あると認識する。その認識確度が規定値より低い場合、
1′北」の左半分と右半分をそれぞれ切出して認識し、
その両方の認識確度が「北」の認識確度より高ければ、
それぞれの文字であると認識し、そうでなければ「北」
であると認識する。
(ロ)の例では、w (1) <w (2)であれはw
(2)の幅の白◇r(域を境にして「46」を一つの文
字として切出し、認識する。この認識イ1τflαは当
然低いので、「4」と「6」に分割して切出し認識する
。w (1) >w (2)の場合は、「4」で認識す
るだけである。
(ハ)の例では、 w (3)の幅の白領域の位置から
前の部分を切出して認識し、その認識確度が低い場合に
は、その部分をW(1)の幅の白領域を境にして二つに
分(づて切出しLz識を行い、また同じ部分をw(2)
の幅の白領域を境にして2分割して切出し認識する。そ
れぞれの組みの2文字の認識確度を第1候補と比較する
ことにより最終的に認識する。
ステップ33により制御フラグか2に設定された場合、
ステップ36を実行する。二\での処理を第10図に示
す垂直射影の例によって説明する。
ます、(イ)に示すように、処理範囲内の最初の黒領域
■の開始アドレスから1ピツチの幅に入る黒領域(+)
 、 clり、 Gl)について処理する。最初に黒領
域(Vのイメージを文字として切出して認識し、次に黒
領域0)、(2)に対応するイメージを文字として切出
して認識し、最後に黒oCt域(υ、■、■に対応する
イメージを文字として切出し認識する。それぞれの3g
識結果の中で最も認識確度の高いものを認識結果とする
例えば黒領域■のイメージの認識確度が最高であれば1
次は(ロ)に示すように、黒領域■の開始アドレスから
1ピツチの幅に入る黒領域■、■。
■について同様に処理する。その結果、黒領域(2)。
■の範囲により切出したイメージの認識確度が最高とな
った場合、次は(ハ)に示すように、黒領域(す、■、
(6)について同様の処理を行う。これが例えば「川」
であると認識した場合、最後の黒領域(Vについて切出
し認識を析う。
このようにして文字切出し認識の処理が終了すると、処
理済みの黒領域および白領域のデータを主記憶装置2よ
り削除し、ステップ23より後続の黒領域について処理
を実行する。
以上のような処理により、第11図または第12図に示
すような不定ピッチの文字列についても。
適切な文字切出を竹って認識することができる。
なお、処理の詳細については必要に応じて変更可能であ
り、処理を実行するための装置構成も同様である。
〔効 果〕
以−ヒの説明から明らかなように、本発明によれば、名
刺や雑誌のような不定ピッチの原稿の場合でも、文字を
適切に切出して認識することができるため、不定ピッチ
JJ+I槁の認識率を向上し、またOCRの読取り対象
JJil稿の種類を飛躍的に拡大できる。
【図面の簡単な説明】
第1図は本発明により文字認識処理を実行するための装
置構成の一実施例を示すブロック図、第2図は処理の概
略を示すフローチャート、第3図は条件Iの説明のため
の垂直射影の例を示す図、第4図は条件11の説明のた
めの垂直射影の例を示す図、第5図は条件IIの説明の
ための文字列の例を示す図、第6図は条件I11の説明
のための垂直射影の例を示す図、第7図は条件IIIの
説明のための文字列の例を示す図、第8図は制御フラグ
がOに設定されたj場合の文字切出しおよび認識を説明
するための文字列を示す図、第9図は制御フランが」に
設定された場合の文字切出しおよび認識を説明するため
の文字列の例を示す図、第10図は制御フラグが2に設
定された場合の文字切出しおよび認識を説明するための
文字列の例を示す図、第11図は1ピツチ内に二つの文
字が入った文字列の例を示す図、第12図は一つの文字
が二つのピッチにまたがった文字列の例を示す図である
。 1、、 −  CI)  tJ  、     2  
・・ −L11己憶装 11′t 、;3・・行l:、
lj出し回路、 11・・行バッファ、5・ 取直射影
抽出回路、 (3・・垂直対、影ハソファ、  7・・・特徴抽出回
路、8・・・辞書メモリ、  9・・・マッチンク回路
。 代理人弁理士  鈴 木   誠1“″〕1第 6  
[]       第 7 図bwfi) 第 8  図 中 火石寸 児 戸T lじ=ゾ円′ wi’+)  ω(2) W(リ  W(2) 1ノJt+ ン  町2)

Claims (1)

    【特許請求の範囲】
  1. (1)原稿の読取り画像から文字を切出して認識する文
    字認識装置において、原稿の読取り画像の文字行イメー
    ジを切出し、該文字行イメージの垂直射影を抽出し、文
    字切出し認識処理範囲内における該垂直射影の黒領域お
    よび白領域の幅に応じて該処理範囲内での文字切出し位
    置の推定方法を選択し、該選択した推定方法により推定
    した文字切出し位置にて該処理範囲内の一つまたは複数
    の黒領域に対応したイメージを該文字行イメージより切
    出して認識し、その認識結果に応じて最終的な文字切出
    し位置を決定し、該最終的な文字切出し位置にて切出し
    たイメージの認識結果を最終的な認識結果とすることを
    特徴とする文字認識処理方法。
JP62270013A 1987-10-26 1987-10-26 文字認識処理方法 Pending JPH01112388A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP62270013A JPH01112388A (ja) 1987-10-26 1987-10-26 文字認識処理方法
US07/259,134 US5033097A (en) 1987-10-26 1988-10-18 Character recognition method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62270013A JPH01112388A (ja) 1987-10-26 1987-10-26 文字認識処理方法

Publications (1)

Publication Number Publication Date
JPH01112388A true JPH01112388A (ja) 1989-05-01

Family

ID=17480333

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62270013A Pending JPH01112388A (ja) 1987-10-26 1987-10-26 文字認識処理方法

Country Status (2)

Country Link
US (1) US5033097A (ja)
JP (1) JPH01112388A (ja)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5253305A (en) * 1991-06-25 1993-10-12 Industrial Technology Research Institute Character boundary identification method and system
EP0831418B1 (en) * 1991-10-21 2002-03-13 Canon Kabushiki Kaisha Method and apparatus for character recognition
US5757979A (en) * 1991-10-30 1998-05-26 Fuji Electric Co., Ltd. Apparatus and method for nonlinear normalization of image
CA2077970C (en) * 1991-11-19 1999-02-23 Daniel P. Huttenlocher Optical word recognition by examination of word shape
WO1993018484A1 (en) * 1992-03-10 1993-09-16 Oracle Corporation Method and apparatus for comparison of data strings
US5521985A (en) * 1992-08-13 1996-05-28 International Business Machines Corporation Apparatus for recognizing machine generated or handprinted text
EP0609474A1 (en) * 1993-02-03 1994-08-10 International Business Machines Corporation Method and apparatus for transforming an image for classification or pattern recognition
US5410611A (en) * 1993-12-17 1995-04-25 Xerox Corporation Method for identifying word bounding boxes in text
JP3096388B2 (ja) * 1994-06-22 2000-10-10 シャープ株式会社 電子複写機における自動画質調整装置
US6052483A (en) * 1994-11-04 2000-04-18 Lucent Technologies Inc. Methods and apparatus for classification of images using distribution maps
JP3805005B2 (ja) * 1994-11-09 2006-08-02 キヤノン株式会社 画像処理装置及び光学的文字認識装置及びそれらの方法
US5737443A (en) * 1994-11-14 1998-04-07 Motorola, Inc. Method of joining handwritten input
CN1102275C (zh) * 1994-11-14 2003-02-26 摩托罗拉公司 分解手写体输入的装置和方法
CA2176691C (en) * 1995-05-15 2004-04-13 Junji Tanaka Hand-written character recognition apparatus and facsimile apparatus
JP3216983B2 (ja) * 1996-02-27 2001-10-09 インターナショナル・ビジネス・マシーンズ・コーポレーション 文字認識装置および文字認識方法
US5862259A (en) * 1996-03-27 1999-01-19 Caere Corporation Pattern recognition employing arbitrary segmentation and compound probabilistic evaluation
US5915039A (en) * 1996-11-12 1999-06-22 International Business Machines Corporation Method and means for extracting fixed-pitch characters on noisy images with complex background prior to character recognition
JP2836681B2 (ja) * 1997-01-14 1998-12-14 日本電気株式会社 パタンマッチング符号化方法及び符号化装置
SG71018A1 (en) * 1997-03-01 2000-03-21 Inst Of Systems Science Nat Un Robust identification code recognition system
US6357658B1 (en) 1999-04-28 2002-03-19 Peripheral Dynamics, Inc. Apparatus and methods for scanning documents including OMR, bar-code, and image data
JP2001060247A (ja) * 1999-06-14 2001-03-06 Fuji Xerox Co Ltd 画像処理装置および画像処理方法
EP1196884A2 (en) * 1999-06-22 2002-04-17 Peripheral Dynamics, Inc. Apparatus and methods for image scanning of variable sized documents having variable orientations
CN1310181C (zh) * 2004-09-15 2007-04-11 北京中星微电子有限公司 一种带摄像装置移动终端的光符识别处理方法
US8170291B2 (en) 2008-05-09 2012-05-01 The United States Postal Service Methods and systems for analyzing the quality of digital signature confirmation images

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5998283A (ja) * 1982-11-27 1984-06-06 Hitachi Ltd パターン切出しおよび認識方法、ならびにそのシステム
US4635290A (en) * 1983-12-20 1987-01-06 Nec Corporation Sectioning apparatus and method for optical character reader systems
DE3538639A1 (de) * 1984-10-31 1986-04-30 Canon K.K., Tokio/Tokyo Bildverarbeitungssystem
JPS63158678A (ja) * 1986-12-23 1988-07-01 Sharp Corp 単語間スペ−ス検出方法
JPS63182793A (ja) * 1987-01-26 1988-07-28 Sharp Corp 文字切り出し方式

Also Published As

Publication number Publication date
US5033097A (en) 1991-07-16

Similar Documents

Publication Publication Date Title
JPH01112388A (ja) 文字認識処理方法
US7437002B2 (en) Image recognition system utilizing an edge image and a binary image
JP3878401B2 (ja) 画像処理装置、画像処理方法およびそれを記録した記録媒体
JPS63155386A (ja) 帳票デ−タ読取装置
JP4632443B2 (ja) 画像処理装置及び画像処理方法並びにプログラム
RU2648636C2 (ru) Сохранение контента в конвертированных документах
JP3099797B2 (ja) 文字認識装置
JP2001076095A (ja) 情報処理装置及びその方法
US20180089157A1 (en) Text editing in an image of a document
US11657632B2 (en) Image processing device, image reading device, image processing method, and non-transitory computer readable medium, using two pieces of image data
JP2002109470A (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
CN112580594A (zh) 文档识别方法、装置、计算机设备和存储介质
JPH0991371A (ja) 文字表示装置
JP3140079B2 (ja) 罫線認識方法及び表処理方法
US20240062567A1 (en) Learning Image Generation Apparatus, Learning Image Generation Method, And Non-Transitory Computer-Readable Recording Medium
JP4083723B2 (ja) 画像処理装置
US20240193217A1 (en) Information processing apparatus, method of controlling information processing apparatus, and storage medium
JPS5949671A (ja) 光学的文字読取装置
JPS63101983A (ja) 文字列抽出方式
JPH02255996A (ja) 文字切出し方法
JPH04130979A (ja) 文字画像切出し方法
JP4957570B2 (ja) 画像処理装置
JPS63269267A (ja) 文字認識方法
JPS6327990A (ja) 文字認識方法
JP2890788B2 (ja) 文書認識装置