JP3195405B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP3195405B2
JP3195405B2 JP10050592A JP10050592A JP3195405B2 JP 3195405 B2 JP3195405 B2 JP 3195405B2 JP 10050592 A JP10050592 A JP 10050592A JP 10050592 A JP10050592 A JP 10050592A JP 3195405 B2 JP3195405 B2 JP 3195405B2
Authority
JP
Japan
Prior art keywords
total value
unit
cell
column
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP10050592A
Other languages
English (en)
Other versions
JPH05274466A (ja
Inventor
吾朗 別所
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP10050592A priority Critical patent/JP3195405B2/ja
Publication of JPH05274466A publication Critical patent/JPH05274466A/ja
Application granted granted Critical
Publication of JP3195405B2 publication Critical patent/JP3195405B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【技術分野】本発明は、文字認識装置に関し、より詳細
には、表形式文書、例えば帳票上に記入された文字を読
み取る文字認識装置に関する。
【0002】
【従来技術】文字認識置において文書画像を処理する場
合、画像を文字領域や写真や図等のイメージ領域や表領
域等に分割し、それぞれ別の処理を行うことが多い。表
領域に関しては、罫線の位置座標を用いて表中の各枠を
認識し、各枠内の画像より文字を切り出して認識する方
法がとられている。このような表の処理において、従来
は、枠を構成する主走査方向及び副走査方向の罫線の矩
形を抽出し、この矩形の内側(枠内より見て)の座標を
用いて枠を定義している。しかし、文書画像が傾いて入
力された場合に、枠内の文字を正しく切り出すことがで
きなくなるという問題があった。
【0003】この点を解決するために、例えば、特開平
3−172984号公報に「表処理方法」が提案されて
いる。この公報のものは、表領域において、主走査方向
及び副走査方向の罫線の矩形の外側の座標を用いて認識
し、枠内の黒連結の外接矩形を求め、枠に接している外
接矩形を除去し、残った外接矩形を用いて枠内の文字を
切り出すものである。しかしながら、罫線を抽出し、枠
内の文字を切り出して認識しているものの、認識結果の
誤認識に対する修正方法については考慮されていない。
【0004】文字認識において、表中の文字を認識する
場合には、数字の認識を行うことが多い。しかし、数字
の認識は言語情報等の後処理が使いにくく、パターンマ
ッチングによる認識の性能に依存する部分がある。ま
た、特に数字の認識に対しては、他の一般文書に比べて
高い精度の認識率を要求される傾向がある。そこで、認
識結果の誤認識の修正技術が重要になってくる。
【0005】
【目的】本発明は、上述のごとき実情に鑑みてなされた
もので、帳票上に記入された文字の読み取りにおける数
表の読み取りに関し、数表に見られる合計値の欄に着目
して、誤認識した箇所を容易に発見できることを可能に
した文字認識装置を提供することを目的としてなされた
ものである。
【0006】
【構成】本発明は、上記目的を達成するために、(1)
スキャナ等を用いて文書画像を読み取る2値画像入力部
と、該2値画像入力部により入力されたデータの表領域
に対して枠内の文字を抽出する枠内文字抽出部と、該枠
内文字抽出部の文字を認識する文字認識部と、該文字認
識部により認識された枠内の文字のうち、行方向の各セ
ル内の数字の合計値を算出する合計値算出部と、該合計
値算出部により算出された合計値とセルの合計値欄の認
識結果とを照合する合計値照合部と、該合計値照合部の
照合の結果の異なっている場合には、行全体の認識結果
の数字の表示方法を変える結果表示部とから成り、誤認
識したことの通知を行う文字認識装置において、前記行
内の各セル内の文字のサイズを求め、一番左側の列のセ
ル内の文字の平均サイズとその行の他のセル内の文字の
平均サイズを比較し、その差が一定値以上離れている場
合には、一番左側の列のセルは数字のセルでないと判断
し、セルの合計値の計算には含めないこと、或いは、
(2)スキャナ等を用いて文書画像を読み取る2値画像
入力部と、該2値画像入力部により入力されたデータの
表領域に対して枠内の文字を抽出する枠内文字抽出部
と、該枠内文字抽出部の文字を認識する文字認識部と、
該文字認識部により認識された枠内の文字のうち、列方
向の各セル内の数字の合計値を算出する合計値算出部
と、該合計値算出部により算出された合計値とセルの合
計値欄の認識結果とを照合する合計値照合部と、該合計
値照合部の照合の結果の異なっている場合には、列全体
の認識結果の数字の表示方法を変える結果表示部とから
成り、誤認識したことの通知を行う文字認識装置におい
て、前記行内の各セル内の文字のサイズを求め、一番上
側の行のセル内の文字の平均サイズとその列の他のセル
内の文字の平均サイズを比較し、その差が一定値以上離
れている場合には、一番上側の行のセルは数字のセルで
ないと判断し、セルの合計値の計算には含めないこと、
或いは、(3)スキャナ等を用いて文書画像を読み取る
2値画像入力部と、該2値画像入力部により入力された
データの表領域に対して枠内の文字を抽出する枠内文字
抽出部と、該枠内文字抽出部の文字を認識する文字認識
部と、該文字認識部により認識された枠内の文字のう
ち、行方向及び列方向の各セル内の数字の合計値を算出
する合計値算出部と、該合計値算出部により算出された
合計値とセルの合計値欄の認識結果とを照合する合計値
照合部と、該合計値照合部の照合の結果、合計値が行及
び列ともに異なっている場合には、行及び列に対応する
セルの認識結果の数字の表示方法を変える結果表示部と
から成り、誤認識したことの通知を行う文字認識装置に
おいて、前記各セル内の文字のサイズを全て求め、注目
する列の一番上側の行のセル内の文字の平均サイズとそ
の列の他のセル内の文字の平均サイズを比較し、その差
が一定値以上離れている場合には、一番上側の行のセル
は数字のセルでないと判断し、セルの合計値の計算には
含めず、また注目する行の一番左側の列のセル内の文字
の平均サイズとその行の他のセル内の文字の平均サイズ
を比較し、その差が一定値以上離れている場合には、一
番左側の列のセルは数字のセルでないと判断し、セルの
合計値の計算には含めないこと、或いは、(4)スキャ
ナ等を用いて文書画像を読み取る2値画像入力部と、該
2値画像入力部により入力されたデータの表領域に対し
て枠内の文字を抽出する枠内文字抽出部と、該枠内文字
抽出部の文字を認識する文字認識部と、該文字認識部に
より認識された枠内の文字のうち、行方向の各セル内の
数字の合計値を算出する合計値算出部と、該合計値算出
部により算出された合計値とセルの合計値欄の認識結果
とを照合する合計値照合部と、該合計値照合部の照合の
結果の異なっている場合には、行全体の認識結果の数字
の表示方法を変える結果表示部とから成り、誤認識した
ことの通知を行う文字認識装置において、前記行方向の
合計値欄を求めるのに、一番右側の列のセルを用い、ま
た、行内の各セル内の文字のサイズを求め、一番左側の
列のセル内の文字の平均サイズとその行の他のセル内の
文字の平均サイズを比較し、その差が一定値以上離れて
いる場合には、一番左側の列のセルは数字のセルでない
と判断し、セルの合計値の計算には含めないこと、或い
は、(5)スキャナ等を用いて文書画像を読み取る2値
画像入力部と、該2値画像入力部により入力されたデー
タの表領域に対して枠内の文字を抽出する枠内文字抽出
部と、該枠内文字抽出部の文字を認識する文字認識部
と、該文字認識部により認識された枠内の文字のうち、
列方向の各セル内の数字の合計値を算出する合計値算出
部と、該合計値算出部により算出された合計値とセルの
合計値欄の認識結果とを照合する合計値照合部と、該合
計値照合部の照合の結果の異なっている場合には、列
体の認識結果の数字の表示方法を変える結果表示部とか
ら成り、誤認識したことの通知を行う文字認識装置にお
いて、前記列方向の合計値欄を求めるのに、一番下側の
列のセルを用い、また、列内の各セル内の文字のサイズ
を求め、一番上側の行のセル内の文字の平均サイズとそ
の列の他のセル内の文字の平均サイズを比較し、その差
が一定値以上離れている場合には、一番上側の行のセル
は数字のセルでないと判断し、セルの合計値の計算には
含めないこと、或いは、(6)スキャナ等を用いて文書
画像を読み取る2値画像入力部と、該2値画像入力部に
より入力されたデータの表領域に対して枠内の文字を抽
出する枠内文字抽出部と、該枠内文字抽出部の文字を認
識する文字認識部と、該文字認識部により認識された枠
内の文字のうち、行方向及び列方向の各セル内の数字の
合計値を算出する合計値算出部と、該合計値算出部によ
り算出された合計値とセルの合計値欄の認識結果とを照
合する合計値照合部と、該合計値照合部の照合の結果、
合計値が行及び列ともに異なっている場合には、行及び
列に対応するセルの認識結果の数字の表示方法を変える
結果表示部とから成り、誤認識したことの通知を行う文
字認識装置において、前記行方向の合計値欄を求めるの
に、一番右側の列のセルを用い、列方向の合計値欄を求
めるには、一番下側の行のセルを用い、また、各セル内
の文字のサイズを全て求め、注目する列の一番上側の行
のセル内の文字の平均サイズとその列の他のセル内の文
字の平均サイズを比較し、その差が一定値以上離れてい
る場合には、一番上側の行セルは数字のセルでないと判
断し、セルの合計値の計算には含めず、また注目する行
の一番左側の列のセル内の文字の平均サイズとその行の
他のセル内の文字の平均サイズを比較し、その差が一定
値以上離れている場合には、一番左側の列のセルは数字
のセルでないと判断し、セルの合計値の計算には含めな
いことを特徴とする文字認識装置。
【0007】図1は、本発明が適用される文字認識装置
一例を説明するための構成図で、図中、1は2値画像
入力部、2は2値イメージメモリ、3は枠内文字抽出
部、4は文字認識部、5は認識結果メモリ、6は合計値
算出部、7は合計値メモリ、8は合計値照合部、9は結
果表示部である。スキャナ等の2値画像入力装置1を用
いて文書画像を読み取り、2値イメージメモリ2に保有
し、そのイメージデータの表領域に対して枠内文字抽出
部3で文字を抽出する。文字認識部中で枠内の文字を認
識し、認識結果メモリ5に保有する。合計値算出部6に
おいて、行方向及び又は列方向の各セル内の数字の合計
値を算出し、合計値メモリ7に保有する。合計値照合部
8において、算出された合計値とセルの合計値欄の認識
結果とを照合する。照合の結果合計値の異なっているセ
ルについては、結果表示部9において、通常の場合と表
示方法を変えて表示する。
【0008】最初に、図1に示した文字認識装置の使
例について具体的に説明する。使用例1 スキャナ等の2値画像入力装置1を用いて文書や帳
票を読み込み、2値イメージメモリ2に格納する。
該2値イメージメモリ2に読み込んだ2値イメージの表
領域に対して、枠内文字抽出部3において文字を抽出す
る。 文字認識部4において、抽出された文字を認識
し、その結果を認識結果メモリ5に格納する。 行方
向(横方向)の合計値欄を指定する。 合計値算出部
6において、注目している行の各セル内の認識結果の数
値を合計値欄を除いて全て合計し、その結果を合計値メ
モリ7に格納する。 合計値照合部8において、前記
合計値算出部で求めた合計値と指定した合計値欄の認識
結果の数値を照合する。 前記合計値照合部の照合の
結果、合計値が一致しなかった場合には、結果表示部9
においてその行全体の認識結果の数字を、例えば色を変
えるなどの方法をとり、通常の表示方法と変えて表示す
る。 以上の操作を全ての行に対して行う。出力結果
の例としては図2のようになる。これにより、行方向に
合計値のある表に対して、認識結果の誤認識を発見しや
すくなり、結果の修正作業が格段に容易になる。
【0009】使用例2 前記使用例1と異なるところは、行方向に対して行って
いる部分に対して、列方向で行うことである。出力結果
の例は図3のようになる。これにより、列方向に合計値
のある表に対して、認識結果の誤認識を発見しやすくな
り、結果の修正作業が格段に容易になる。
【0010】使用例3 文字認識部4で文字認識を行うところまでは前記使用
と同様である。 行方向(横方向)および列方向(縦
方向)の合計値欄を指定する。 合計値算出部6にお
いて、注目している行の各セル内の認識結果の数値を合
計値欄を除いて全て合計し、その結果を行の合計値メモ
リ7に格納する。列方向に対しても同様の操作を行い、
列の合計値メモリ7に格納する。 合計値照合部8に
おいて、合計値算出部6で求めた合計値と指定した合計
値欄の認識結果の数値を照合する。 前記合計値照合
部8の照合を全ての行と列に対して行う。 照合の結
果,行・列ともに一致しなかったセルに対応する認識結
果の数字を、例えば色を変えるなどの方法で、通常の表
示方法と変えて表示する。出力結果の例としては、図4
のようになる。これにより、行方向および列方向の両方
に合計値のある表に対しては、認識結果の誤認識をセル
単位で発見しやすくなり、結果の修正作業が格段に容易
になる。
【0011】使用例4 前記使用例1と異なる部分は行方向の合計値欄の指定を
行わず、一番右側の列のセルがその行の合計値欄になる
という性質を利用して、自動的に行うことである。これ
により、行方向に合計値のある表に対しては、合計値欄
の指定という手間が減り、作業効率が向上する。
【0012】使用例5 前記使用例4と異なるところは、行方向に対して行って
いる部分に対して列方向で行うことである。すなわち、
列方向の合計値欄が一番下側の行になるという性質を利
用して、自動的に行うことである。これにより、列方向
に合計値のある表に対しては、合計値欄の指定という手
間が減り、作業効率が向上する。
【0013】使用例6 前記使用例4と異なる部分は、行方向に行うだけでな
く、列方向にも並列で行うことである。すなわち、行方
向の合計値欄は一番右側の列に、列方向の合計値欄は一
番下側の行になるという性質を利用して、自動的に行う
ことである。これにより、行方向および列方向の両方に
合計値のある表に対しても、合計値欄の指定という手間
が減り、作業効率が向上する。
【0014】実施例1 求項に対する実施 前記使用例1と異なる部分は、次の点である。 一番
左側の列の文字サイズの平均(Wl)を求める。文字サ
イズを求めるには、文字を切り出した時の文字幅を用い
ることにする。その行の他のセル内の文字サイズの平均
(Wc)を求める。 |Wl − Wc| > Th (Thは一定値) ならば、一番左側の列は数字のセルではないと判断し、
セルの合計値の算出には用いないこととする。上式を満
たさない場合は、全ての行が数字のセルから構成されて
いるとみなす。これにより、一番左側の列に項目名など
の日本語のデータが書かれているセルがある数表に対し
ても、自動的にセルを選択して処理することが可能にな
る。
【0015】実施例2 求項に対する実施例 前記実施例と異なる部分は、一番左側の列のかわり
に、一番上側の行に数字以外の文字が書かれているか否
かの判断を行う点である。これにより、一番上側の行に
項目名などの日本語のデータが書かれているセルがある
数表に対しても、自動的にセルを選択して処理すること
が可能になる。
【0016】実施例 求項に対する実施 実施例と異なる部分は、一番左側の列だけでなく、一
番上側の行にも数字以外の文字が書かれているか否かの
判断を行う点である。これにより、一番左側および一番
上側の行に項目名などの日本語のデータが書かれている
セルがある数表に対しても、自動的にセルを選択して処
理することが可能になる。
【0017】実施例4 求項に対する実施 実施例と異なる部分は、行方向の合計値欄の指定を行
わず、一番右側の列のセルがその行の合計値欄になると
いう性質を利用して、自動的に行うことである。これに
より、行方向に合計値のある表に対しては、合計値欄の
指定という手間が減り、作業効率が向上する。また、一
番左側の列に項目名などの日本語のデータが書かれてい
るセルがある数表に対しても、自動的にセルを選択して
処理することが可能になる。
【0018】実施例5 求項に対する実施 実施例と異なる部分は、行方向に対して行っている部
分に対して、列方向で行うことである。すなわち、列方
向の合計値欄が一番下側の行になるという性質を利用し
て自動的に行うことと、一番左側の列のかわりに一番上
側の行に数字以外の文字が書かれているか否かの判断を
行う点である。これにより、列方向に合計値のある表に
対しては、合計値欄の指定という手間が減り、作業効率
が向上する。また、一番上側の行に項目名などの日本語
のデータが書かれているセルがある数表に対しても、自
動的にセルを選択して処理することが可能になる。
【0019】実施例6 求項に対する実施 実施例と異なる部分は、行方向に行うだけでなく、列
方向にも並列で行うことである。すなわち、行方向の合
計値欄は一番右側の列に、列方向の合計値欄は一番下側
の行になるという性質を利用して自動的に行い、一番左
側の列だけでなく、一番上側の行にも数字以外の文字が
書かれているか否かの判断を行う点である。これによ
り、行方向および列方向の両方に合計値のある表に対し
ても合計値欄の指定という手間が減り、作業効率が向上
する。また、一番左側および一番上側の行に項目名など
の日本語のデータが書かれているセルがある数表に対し
ても、自動的にセルを選択して処理することが可能にな
る。
【0020】
【効果】以上の説明から明らかなように、本発明による
と、以下のような効果がある。 ()請求項に対応する効果:一番左側の列に項目名
などの日本語のデータが書かれているセルがある数表に
対しても、自動的にセルを選択して処理することが可能
になる。 ()請求項に対応する効果:一番上側の行に項目名
などの日本語のデータが書かれているセルがある数表に
対しても、自動的にセルを選択して処理することが可能
になる。 ()請求項に対応する効果:一番左側および一番上
側の行に項目名などの日本語のデータが書かれているセ
ルがある数表に対しても、自動的にセルを選択して処理
することが可能になる。 ()請求項に対応する効果:行方向に合計値のある
表に対しては、合計値欄の指定という手間が減り、作業
効率が向上する。また、一番左側の列に項目名などの日
本語のデータが書かれているセルがある数表に対して
も、自動的にセルを選択して処理することが可能にな
る。 ()請求項に対応する効果:列方向に合計値のある
表に対しては、合計値欄の指定という手間が減り、作業
効率が向上する。また、一番上側の行に項目名などの日
本語のデータが書かれているセルがある数表に対して
も、自動的にセルを選択して処理することが可能にな
る。 ()請求項に対応する効果:行方向および列方向の
両方に合計値のある表に対しても合計値欄の指定という
手間が減り、作業効率が向上する。また、一番左側およ
び一番上側の行に項目名などの日本語のデータが書かれ
ているセルがある数表に対しても、自動的にセルを選択
して処理することが可能になる。 ()前記(1)〜()に示すように、特に高い認識
率を要求される数表の読み取りに関して、誤認識文字の
発見が一目でできるようになり、修正作業が格段に容易
になる。
【図面の簡単な説明】
【図1】 本発明が適用される文字認識装置の一例を説
明するための構成図である。
【図2】 使用例1の出力結果例を示す図である。
【図3】 使用例2の出力結果例を示す図である。
【図4】 使用例3の出力結果例を示す図である。
【符号の説明】
1…2値画像入力部、2…2値イメージメモリ、3…枠
内文字抽出部、4…文字認識部、5…認識結果メモリ、
6…合計値算出部、7…合計値メモリ、8…合計値照合
部、9…結果表示部。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平3−62280(JP,A) 特開 昭62−139088(JP,A) 特開 昭57−48169(JP,A) 特開 昭60−27077(JP,A) 特開 平4−75187(JP,A) 特開 平3−73084(JP,A) 特開 平1−273168(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/62 G06F 19/00 300 JICSTファイル(JOIS)

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】 スキャナ等を用いて文書画像を読み取る
    2値画像入力部と、該2値画像入力部により入力された
    データの表領域に対して枠内の文字を抽出する枠内文字
    抽出部と、該枠内文字抽出部の文字を認識する文字認識
    部と、該文字認識部により認識された枠内の文字のう
    ち、行方向の各セル内の数字の合計値を算出する合計値
    算出部と、該合計値算出部により算出された合計値とセ
    ルの合計値欄の認識結果とを照合する合計値照合部と、
    該合計値照合部の照合の結果の異なっている場合には、
    行全体の認識結果の数字の表示方法を変える結果表示部
    とから成り、誤認識したことの通知を行う文字認識装置
    において、前記行内の各セル内の文字のサイズを求め、
    一番左側の列のセル内の文字の平均サイズとその行の他
    のセル内の文字の平均サイズを比較し、その差が一定値
    以上離れている場合には、一番左側の列のセルは数字の
    セルでないと判断し、セルの合計値の計算には含めない
    ことを特徴とする文字認識装置。
  2. 【請求項2】 スキャナ等を用いて文書画像を読み取る
    2値画像入力部と、該2値画像入力部により入力された
    データの表領域に対して枠内の文字を抽出する枠内文字
    抽出部と、該枠内文字抽出部の文字を認識する文字認識
    部と、該文字認識部により認識された枠内の文字のう
    ち、列方向の各セル内の数字の合計値を算出する合計値
    算出部と、該合計値算出部により算出された合計値とセ
    ルの合計値欄の認識結果とを照合する合計値照合部と、
    該合計値照合部の照合の結果の異なっている場合には、
    列全体の認識結果の数字の表示方法を変える結果表示部
    とから成り、誤認識したことの通知を行う文字認識装置
    において、前記行内の各セル内の文字のサイズを求め、
    一番上側の行のセル内の文字の平均サイズとその列の他
    のセル内の文字の平均サイズを比較し、その差が一定値
    以上離れている場合には、一番上側の行のセルは数字の
    セルでないと判断し、セルの合計値の計算には含めない
    ことを特徴とする文字認識装置。
  3. 【請求項3】 スキャナ等を用いて文書画像を読み取る
    2値画像入力部と、該2値画像入力部により入力された
    データの表領域に対して枠内の文字を抽出する枠内文字
    抽出部と、該枠内文字抽出部の文字を認識する文字認識
    部と、該文字認識部により認識された枠内の文字のう
    ち、行方向及び列方向の各セル内の数字の合計値を算出
    する合計値算出部と、該合計値算出部により算出された
    合計値とセルの合計値欄の認識結果とを照合する合計値
    照合部と、該合計値照合部の照合の結果、合計値が行及
    び列ともに異なっている場合には、行及び列に対応する
    セルの認識結果の数字の表示方法を変える結果表示部と
    から成り、誤認識したことの通知を行う文字認識装置に
    おいて、前記各セル内の文字のサイズを全て求め、注目
    する列の一番上側の行のセル内の文字の平均サイズとそ
    の列の他のセル内の文字の平均サイズを比較し、その差
    が一定値以上離れている場合には、一番上側の行のセル
    は数字のセルでないと判断し、セルの合計値の計算には
    含めず、また注目する行の一番左側の列のセル内の文字
    の平均サイズとその行の他のセル内の文字の平均サイズ
    を比較し、その差が一定値以上離れている場合には、一
    番左側の列のセルは数字のセルでないと判断し、セルの
    合計値の計算には含めないことを特徴とする文字認識装
    置。
  4. 【請求項4】 スキャナ等を用いて文書画像を読み取る
    2値画像入力部と、該2値画像入力部により入力された
    データの表領域に対して枠内の文字を抽出する枠内文字
    抽出部と、該枠内文字抽出部の文字を認識する文字認識
    部と、該文字認識部により認識された枠内の文字のう
    ち、行方向の各セル内の数字の合計値を算出する合計値
    算出部と、該合計値算出部により算出された合計値とセ
    ルの合計値欄の認識結果とを照合する合計値照合部と、
    該合計値照合部の照合の結果の異なっている場合には、
    行全体の認識結果の数字の表示方法を変える結果表示部
    とから成り、誤認識したことの通知を行う文字認識装置
    において、前記行方向の合計値欄を求めるのに、一番右
    側の列のセルを用い、また、行内の各セル内の文字のサ
    イズを求め、一番左側の列のセル内の文字の平均サイズ
    とその行の他のセル内の文字の平均サイズを比較し、そ
    の差が一定値以上離れている場合には、一番左側の列の
    セルは数字のセルでないと判断し、セルの合計値の計算
    には含めないことを特徴とする文字認識装置。
  5. 【請求項5】 スキャナ等を用いて文書画像を読み取る
    2値画像入力部と、該2値画像入力部により入力された
    データの表領域に対して枠内の文字を抽出する枠内文字
    抽出部と、該枠内文字抽出部の文字を認識する文字認識
    部と、該文字認識部により認識された枠内の文字のう
    ち、列方向の各セル内の数字の合計値を 算出する合計値
    算出部と、該合計値算出部により算出された合計値とセ
    ルの合計値欄の認識結果とを照合する合計値照合部と、
    該合計値照合部の照合の結果の異なっている場合には、
    列全体の認識結果の数字の表示方法を変える結果表示部
    とから成り、誤認識したことの通知を行う文字認識装置
    において、前記列方向の合計値欄を求めるのに、一番下
    側の列のセルを用い、また、列内の各セル内の文字のサ
    イズを求め、一番上側の行のセル内の文字の平均サイズ
    とその列の他のセル内の文字の平均サイズを比較し、そ
    の差が一定値以上離れている場合には、一番上側の行の
    セルは数字のセルでないと判断し、セルの合計値の計算
    には含めないことを特徴とする文字認識装置。
  6. 【請求項6】 スキャナ等を用いて文書画像を読み取る
    2値画像入力部と、該2値画像入力部により入力された
    データの表領域に対して枠内の文字を抽出する枠内文字
    抽出部と、該枠内文字抽出部の文字を認識する文字認識
    部と、該文字認識部により認識された枠内の文字のう
    ち、行方向及び列方向の各セル内の数字の合計値を算出
    する合計値算出部と、該合計値算出部により算出された
    合計値とセルの合計値欄の認識結果とを照合する合計値
    照合部と、該合計値照合部の照合の結果、合計値が行及
    び列ともに異なっている場合には、行及び列に対応する
    セルの認識結果の数字の表示方法を変える結果表示部と
    から成り、誤認識したことの通知を行う文字認識装置に
    おいて、前記行方向の合計値欄を求めるのに、一番右側
    の列のセルを用い、列方向の合計値欄を求めるには、一
    番下側の行のセルを用い、また、各セル内の文字のサイ
    ズを全て求め、注目する列の一番上側の行のセル内の文
    字の平均サイズとその列の他のセル内の文字の平均サイ
    ズを比較し、その差が一定値以上離れている場合には、
    一番上側の行セルは数字のセルでないと判断し、セルの
    合計値の計算には含めず、また注目する行の一番左側の
    列のセル内の文字の平均サイズとその行の他のセル内の
    文字の平均サイズを比較し、その差が一定値以上離れて
    いる場合には、一番左側の列のセルは数字のセルでない
    と判断し、セルの合計値の計算には含めないことを特徴
    とする文字認識装置。
JP10050592A 1992-03-25 1992-03-25 文字認識装置 Expired - Fee Related JP3195405B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10050592A JP3195405B2 (ja) 1992-03-25 1992-03-25 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10050592A JP3195405B2 (ja) 1992-03-25 1992-03-25 文字認識装置

Publications (2)

Publication Number Publication Date
JPH05274466A JPH05274466A (ja) 1993-10-22
JP3195405B2 true JP3195405B2 (ja) 2001-08-06

Family

ID=14275806

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10050592A Expired - Fee Related JP3195405B2 (ja) 1992-03-25 1992-03-25 文字認識装置

Country Status (1)

Country Link
JP (1) JP3195405B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4742404B2 (ja) * 2000-05-17 2011-08-10 コニカミノルタビジネステクノロジーズ株式会社 画像認識装置、画像形成装置、画像認識方法および画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体

Also Published As

Publication number Publication date
JPH05274466A (ja) 1993-10-22

Similar Documents

Publication Publication Date Title
US5664027A (en) Methods and apparatus for inferring orientation of lines of text
KR100412317B1 (ko) 문자인식/수정방법및장치
US6970601B1 (en) Form search apparatus and method
JP3294995B2 (ja) 帳票読取装置
JP3411472B2 (ja) パターン抽出装置
US20080131000A1 (en) Method for generating typographical line
JP2000315247A (ja) 文字認識装置
JP3195405B2 (ja) 文字認識装置
JPH0423185A (ja) 自動セル属性判定機能を有する表読取装置
JPH0410087A (ja) 基本ライン抽出方法
JP3524339B2 (ja) 光学式文字読取装置用帳票のフォーマット情報生成方法
JP3812719B2 (ja) 文書検索装置
JP3071048B2 (ja) 文字認識装置及び方法
JP3122476B2 (ja) 自動文書清書装置
JP2931485B2 (ja) 文字切出し装置及び方法
JP2963474B2 (ja) 類似文字識別方法
JPS6240574A (ja) ワ−ドプロセツサ
JP2671533B2 (ja) 文字列認識方法及びその装置
JP2677271B2 (ja) 文字認識装置
JP3377719B2 (ja) 文字認識装置及びコンピュータ読み取り可能な記録媒体
JP3064508B2 (ja) 文書認識装置
JPH03126188A (ja) 文字認識装置
JPH0950488A (ja) 異サイズ混在文字列の読取り方法
JPH04372089A (ja) 文字認識方法
CN115546817A (zh) 一种文档解析的方法及装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090601

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090601

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100601

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110601

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees