JP3435374B2 - 文字読取装置および文字認識方法 - Google Patents

文字読取装置および文字認識方法

Info

Publication number
JP3435374B2
JP3435374B2 JP28282999A JP28282999A JP3435374B2 JP 3435374 B2 JP3435374 B2 JP 3435374B2 JP 28282999 A JP28282999 A JP 28282999A JP 28282999 A JP28282999 A JP 28282999A JP 3435374 B2 JP3435374 B2 JP 3435374B2
Authority
JP
Japan
Prior art keywords
cell
item
data
character
read
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP28282999A
Other languages
English (en)
Other versions
JP2001101340A (ja
Inventor
博一 岩下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP28282999A priority Critical patent/JP3435374B2/ja
Publication of JP2001101340A publication Critical patent/JP2001101340A/ja
Application granted granted Critical
Publication of JP3435374B2 publication Critical patent/JP3435374B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字読取装置およ
び文字認識方法に関し、たとえば複雑な表構造や表の構
成を有する帳票を読み込み、得られたイメージから記録
された文字を項目に対応して読み取るOCR システム等に
用いて好適なものである。
【0002】
【従来の技術】これまで、たとえば紙等に書かれた情報
を光学的に読み取り、読み取った情報のうち指定された
範囲の情報(イメージ)に対応するディジタル情報を認
識して情報処理装置が取り扱いやすいデータに変換する
光学式文字読取り装置(OCR: Optical Character Reade
r )がある。この装置は、すでにあるたとえば、手書き
等の情報を情報処理装置の扱いやすいデータに変換する
ため再入力する手間を省くことやその際の誤入力を避け
ることができるので非常に有用であり、様々な分野で用
いられている。
【0003】個々の情報を集計したりすることの多い、
特に、ビジネス分野では有効に活用されている。この分
野では、表形式の帳票が大量に処理される。表形式の帳
票には罫線が水平方向や垂直方向に引かれている。罫線
で囲われた領域は、一般に表セルと呼ばれている。
【0004】第1に、この装置で帳票をイメージデータ
として読み込んだときこの表セルを抽出して表解析を行
っている。この場合、抽出によって表セルの座標が得ら
れる。この後、オペレータは、項目のキーとして表の1
行目(項目行)に記述されたキー項目の表セル(キー項
目セル)と、同じキー項目の範囲に属すデータが記述さ
れた項目の表セル(データセル)とを個々の表セルに対
して選別する。キー項目には、内容を識別できる単語が
含まれている。オペレータは、このセルの識別を行って
データセルの読取属性を設定して、列方向の同一項目の
データセルから文字情報を読み取っている。
【0005】また、第2に、たとえば特開平4-128920号
公報の任意方向文字列配列機構を適用して表セルの文字
読取り処理を行う場合、前述と同様に読み込んだ帳票の
イメージデータから表セルを抽出する表解析を行い、項
目行の文字読取り処理を行う。この処理で得られた結果
とあらかじめ登録しておいた読取り領域の属性を示す単
語との比較を行う。これにより、キー項目の属性を判別
して読取り領域の各表示セルの属性を確定する。確定し
た後に同じ属性になる列方向のデータセルの内容を読み
取って自動的な表データの読込みを行っている。
【0006】
【発明が解決しようとする課題】ところで、第1の方法
では、たとえば、10行5列の表がある場合、総数50個の
表セルについて種類の選別が手作業で行われる。この作
業はオペレータに負荷がかかるだけでなく、オペレータ
に難しい判断を迫る場合もある。この難しい判断の例に
は、一つの項目に対してさらに複数の項目が割り当てら
れている複雑な項目行やデータ行がある複合セルの場
合、または表を設定するとともに、まったく表の領域と
は別に新たな領域を用いる表形式を設定し、この表セル
に数値を入力する複数の形式が混在する場合等がある。
このようなときにオペレータが判断を誤る可能性が高く
なり、結果として読取属性の設定ミスを引き起こしてし
まう。
【0007】また、第2の方法では、自動的に表セルの
種類を判別してオペレータの負担を軽減させているが、
上述したと同様の複雑な表セルの構造を持っている場合
や表セルの複数形式が混在している場合に表セルの属性
を自動判別することができない。この場合、オペレータ
が複雑な表セルの読取属性を設定することになるので、
この設定作業はオペレータに負担を強いてしまう。そし
て、オペレータの作業が介在することから、自動的な読
取り処理が可能になるまでに時間がかかり全体的な処理
時間が増えてしまう。
【0008】本発明はこのような従来技術の欠点を解消
し、複雑な表構造が提供されてもオペレータに負荷を強
いることなく、読取処理を正確に、かつ処理時間の大幅
な短縮化を行うことができる文字読取装置および文字認
識方法を提供することを目的とする。
【0009】
【課題を解決するための手段】本発明は上述の課題を解
決するために、情報記録媒体に記録された情報を画像デ
ータとして読み込む情報入力手段と、得られた画像デー
タに含まれる罫線が囲む領域を表セルとし、この表セル
を規定する座標を検出する座標検出手段と、この検出し
た座標の該当する表セルに含まれる文字の認識を行う認
識手段と、得られた画像データと読み取った結果を記憶
する記憶手段とを備えた文字読取装置において、この装
置は、座標検出手段で検出した座標から表示セルの幅お
よび高さを求め、求めた幅および高さが登録された表セ
ルの読取属性を表す構造パラメータに対応するか判定を
行う構造判定機能ブロックを含んだ表セルの照合を行う
照合手段を含むことを特徴とする。
【0010】ここで、認識手段は、読み取った情報と前
記表セルの読取属性に対応したキーとなる項目の単語が
含まれる辞書との照合を行い、情報と項目の一致性を判
定する項目判定機能ブロックを含み、記憶手段には、表
セルの読取属性に関するデータを格納した辞書が含まれ
ていることが好ましい。
【0011】照合手段には、表セルの並び方を表すパラ
メータを解析するパラメータ解析機能ブロックが構造判
定機能ブロックの前に配されることが望ましい。
【0012】記憶手段には、表セルの読取属性の独立ま
たは従属を示す関連情報とキーとなる項目とを結び付け
て記憶する関連情報記憶手段が含まれるとよい。
【0013】また、認識手段には、表セルの読取属性に
対応した文字が複数の表セルにそれぞれあるかどうかを
判定する文字判定機能ブロックが含まれるとよい。
【0014】本発明の文字読取装置は、座標検出手段で
画像データの中から罫線の交点に対応する位置を示す、
検出した座標に基づいて各表セルの大きさ(幅、高さ)
の情報を用いて、登録された表セルの読取属性を表す構
造パラメータのいずれに対応するか構造判定機能ブロッ
クで判定して表セルの照合を行うことにより、読み込ん
だ画像データに含まれる表構造を自動的に認識すること
ができる。
【0015】本発明は上述の課題を解決するために、情
報記録媒体に記録された情報を画像データとして読み込
む画像入力工程と、この画像入力工程で得られた画像デ
ータに含まれる罫線が囲む領域を表セルとし、この表セ
ルを規定する座標を検出する座標検出工程と、この座標
検出工程で検出した座標を基に該当する表セルに含まれ
る文字を認識する認識工程とを備えた文字認識方法にお
いて、この方法は、座標検出によって検出した座標に基
づいて表示セルの照合を行う照合工程を含み、照合工程
は、座標から表示セルの幅および高さをそれぞれ求め、
求めた幅および高さが登録された表セルの読取属性を表
す構造パラメータに対応するか判定を行う構造判定工程
を含むことを特徴とする。
【0016】ここで、表セルの読取属性に対応したキー
となる項目の単語を含む辞書を用意し、この辞書の項目
の単語と表セルから読み取った情報との照合を行い、情
報と項目の一致性を判定する項目認識工程を含み、項目
認識工程は、照合工程の後に行うことが好ましい。
【0017】照合工程の前に、表セルの並び方を表すパ
ラメータを解析するパラメータ解析工程を含むことが望
ましい。
【0018】表セルの読取属性の独立または従属を示す
関連情報とキーとなる項目とを結び付けて記憶する関連
情報記憶手段を用意し、表セルからそれぞれ読み出した
キーとなる項目の単語と関連情報記憶手段が有する項目
と対応させて各表セルの関連性を調べる関連調査工程を
含むことが好ましい。
【0019】認識工程の前に、表セルの読取属性に対応
した文字が複数の表セルにそれぞれあるかどうかを判定
する文字判定工程を含むとよい。
【0020】本発明の文字認識方法は、画像データの中
から罫線の交点に対応する座標検出によって検出した座
標に基づいて表示セルの照合を行う中で、照合工程は、
座標から表示セルの幅および高さをそれぞれ求め、これ
ら得られた情報が登録された表セルの読取属性を表す構
造パラメータのいずれに対応するか判定を行うことによ
り、読み込んだ画像データに含まれる表構造を自動的に
認識する。
【0021】
【発明の実施の形態】本発明によれば、
【0022】
【実施例】次に添付図面を参照して本発明による文字読
取装置の実施例を詳細に説明する。
【0023】本実施例は、本発明の文字読取装置を適用
した光学式文字読取(以下、OCR という)システム10に
ついて説明する。また、本発明と直接関係のない部分に
ついて図示および説明を省略する。ここで、信号の参照
符号はその現れる接続線の参照番号で表す。
【0024】OCR システム10には、操作部12、システム
制御部14、画像入力部16、表示部18、表示セル抽出部2
0、データ記憶部22、表示セル照合部24および認識部26
が備えられている(図1を参照)。これらの各部は、シ
ステムバス28を介してデータおよび制御信号のやりとり
を行っている。
【0025】操作部12には、OCR システム10の処理モー
ドやシステムの設定条件を指定する操作ボタン等のスイ
ッチ(詳細には図示せず)が配設されている。操作ボタ
ンに応じて操作指示信号12a がシステムバス28を介して
システム制御部14に供給される。具体的に操作部12とし
ては、キーボードやマウス等の機器が対応する。
【0026】システム制御部14は、OCR システム10の全
体を統括的に制御する機能を有する。システム制御部14
には、この機能を発揮するため、図示しない中央演算処
理装置 (Central Processing Unit: CPU)や制御を行う
際に用いるプログラム処理の手順が書き込まれたROM (R
ead Only Memory 、図示せず)、そしてこれらの手順に
応じた制御信号を生成する制御部(図示せず)等が含ま
れている。システム制御部14にはこのように各部からの
データと被制御部に対する制御信号を供給する信号線14
a が接続されている。
【0027】画像入力部16には、たとえば、紙を記録媒
体に用いて、紙表面にインクやトナーにより記された情
報を読み取る際にこの紙に光を照射するランプ(図示せ
ず)と、その紙からの反射光を受光する一列または二列
に並べた受光素子のラインセンサと、紙またはラインセ
ンサを走査する走査機構(図示せず)が含まれる。ライ
ンセンサはこの反射光の強弱に応じて画像の濃淡等の情
報として情報を取り込んでいる。ランプの点灯/消灯な
らびにラインセンサにおける光電変換および信号の送出
の制御はシステム制御部14からシステムバス28を介して
行われる。読み込んだ情報(画像データ)16a は、シス
テムバス28を介して表示部18およびデータ記憶部22の画
像メモリ22a に供給される。画像入力部16には、たとえ
ば、イメージスキャナやファクシミリ等の装置を用い
る。画像入力部16は、帳票のように複雑な形式に記入さ
れた文字、図形を光電変換して画像データとして読み込
む。
【0028】表示部18は、供給される画像データ18a を
表示する機能を有する装置である。この装置には、具体
的に液晶表示装置やモニタディスプレイ装置(CRT: Cat
hodeRay Tube )等を用いられる。表示部18へのデータ
の取込み等の制御信号18a もシステム制御部14によりシ
ステムバス28を介して供給される。表示部18に情報を表
示することによりオペレータに対して操作状況やシステ
ムの状況・状態等を知らせることができる。
【0029】表セル抽出部20は、データ記憶部22の画像
メモリ22a に格納しておいた画像データに含まれる罫線
を判定するとともに、判定した罫線の交点位置の座標を
読み出す機能を有する。この座標は、画像データの一点
を原点(図示せず)とした際の相対的な座標である。表
セル抽出部20には、システムバス28を介してシステム制
御部14からの制御信号が供給される。制御信号、および
入力する画像データならびに抽出した座標データの出力
は信号線20a で示している。表セル抽出部20で抽出した
座標データはデータ記憶部22に供給される。
【0030】データ記憶部22には、画像メモリ22a 、読
取属性記憶部22b 、処理データ記憶部22c が備えられて
いる。データ記憶部22に用いられるメモリには、たとえ
ば複数回の画像データの読出しに対応できるように非破
壊型のメモリを用いるとよい。データ記憶部22は、シス
テム制御部14によりデータの入出力が制御されている。
画像メモリ22a は、1枚の帳票を読み出す際にラインセ
ンサの走査速度を最も遅くした分解能で得られる情報量
を格納できる容量を有している。読取属性記憶部22b に
は、読取り対象の項目に関する情報を意味する読取属性
が格納される。画像メモリ22a には、画像入力部16から
読み込んだ画像データが信号線20a 、システムバス28、
信号線22d を介して供給される。
【0031】また、読取属性記憶部22b は、データの読
取り時に誤りなく、表構造を判別するための基準データ
を読取属性として格納している。読取属性記憶部22b
は、信号線22d 、システムバス28を介してこの格納した
基準データを各要求部分に出力する。
【0032】読取属性について簡単に説明する。読取り
対象の項目は、以後、探索項目という。この探索項目の
うち、表セルの内容を表す表セルはキー項目セルと呼
ぶ。そしてキー項目セルに対応して列方向に配されるセ
ルがデータセルである。ここでの読取属性の一例とし
て、図2に示すような読取属性30には、具体的に項目
名、データセルに記述される文字の字種、最大文字数、
知識処理という属性を用意する。一例に銀行用の帳票を
挙げる。項目名には、銀行名、支店名、・・・・、金額が入
る。その文字種はそれぞれの項目名に対応して漢字、漢
字、・・・・、数字+[円]が入る。その最大文字数は、6文
字、6文字、・・・・、6文字である。また、知識処理は、
誤読率を低減させる単語照合のように銀行名か支店名か
を調べる照合処理に用い、図2の記号「−」は金額に対
する知識処理を行わないことを示している。ところで、
金額に対する知識処理は認識結果の数字だけを抽出する
ようにしてもよい。
【0033】図1に戻って、読取属性記憶部22b には、
上述した知識処理に対応可能にするように単語辞書220
が含まれる。そして、読取属性記憶部22b には、この
他、表構造に関するキー項目セルが行方向または列方向
に並ぶ個数および読取対象の表セルを特定する情報等が
表セル構造パラメータとして格納されている。
【0034】処理データ記憶部22c には、抽出データ記
憶部220cおよび認識データ記憶部222cが含まれる。処理
データ記憶部22c は、得られた中間的なデータや最終的
に得られた結果といった何らかの処理に応じて得られた
データを記憶する。抽出データ記憶部220cには、表セル
抽出部20において画像データから抽出した表セルの位置
を表す座標データが信号線20a 、システムバス28、信号
線22d を介して供給される。抽出データ記憶部220cは抽
出した座標データをシステム制御部14の制御により信号
線22d 、システムバス28、信号線24a を介して表セル照
合部24に送出する。認識データ記憶部222cは、認識部26
で行われて得られた結果を格納する記憶部である。認識
データは信号線22d 、システムバス28、信号線24a を介
してシステム制御部14の制御により供給される。
【0035】表セル照合部24には、セル構造判定機能部
24b が含まれる。 表セル照合部24には抽出データ記憶部
220cから表セルの座標データおよび読取属性記憶部22b
からの基準データ(すなわち表セルの構造パターンを示
す表セル構造パラメータ)が供給される。セル構造判定
機能部24b は個々の表セルとの接続した関係がどのよう
な構造パターンにあるかをマッチングにより判定する。
この判定については後段で詳述する。判定は、図3に示
す5つの構造パターン32〜40を分類する。構造パターン
34, 36, 40は、たとえば一つの探索項目に対して複数の
項目を有する表セル構造(複合セル構造)になってい
る。表セル照合部24は、決定した構造パターンにおける
データセルの座標データおよびその読取属性の組を記憶
しておく。この組のデータは、データ記憶部22の処理デ
ータ記憶部22c 内にたとえば、データセル情報記憶部
(図示せず)として記憶させるようにしてもよい。
【0036】認識部26は、表セル照合部24での判定と抽
出データ記憶部220cの各表セルの座標データとを対応さ
せるとともに、読取属性記憶部22b の読取属性も考慮し
て文字認識を行う機能を有している。この文字認識を行
う際に認識部26には上述したデータが各部からシステム
バス28を介して供給される。これらデータ供給および認
識部26はシステム制御部14により制御される。図示しな
いが認識部26には、文字のパターン認識が行えるように
1文字分のパターン切出し(セグメンテーション)が行
われた後、認識アルゴリズムを実行する特徴抽出部、用
意した文字パターン辞書および得られた特徴と辞書のデ
ータとの比較を行って候補文字を決定するパターン識別
部が含まれている。認識部26は、決定した文字等の情報
を認識データ記憶部222cにシステムバス28を介して供給
し、格納する。認識データ記憶部222cは、システム制御
部14のシステムバス28を介した制御により認識したデー
タを出力する。
【0037】OCR システム10は基本的にこのように構成
して表セル構造を判定して複雑な構造の表セルを有す
る、たとえば帳票にも対応して自動的な文字認識を可能
にしている。なお、本実施例ではOCR システム10に画像
入力部16を用意したが、画像データは画像ファイルから
伝送路を介して供給されたり、記録媒体の再生装置を介
して画像ファイルが供給される等の構成でもよい。
【0038】次に、OCR システム10の動作について説明
する。OCR システム10に電源を投入し、初期設定を立ち
上げる。 画像入力部16に読み取りを行う、たとえば、帳
票をセットする。操作部12を介して設定条件等の情報が
信号線12a 、システムバス28、信号線14a を順次介して
システム制御部14に供給される。システム制御部14は、
供給される情報に応じた制御信号14a を、システムバス
28、信号線16a を順次介して供給する。画像入力部16
は、システム制御部14の制御により帳票に所定の波長範
囲の光を照射して帳票からの反射光を受光する。この反
射光には、帳票に記載されている情報が光の強弱として
含まれている。画像入力部16は、反射光をラインセンサ
で受光し、この受光量に応じて光電変換して電気信号に
している。得られた電気信号には、I/E 変換が施され
る。これにより、読み込んだ画像は電圧信号になる。さ
らに、この電圧信号には図示しないA/D 変換部によりデ
ィジタル信号に変換される。このような前処理を行って
得られた画像データがシステム制御部14の制御により、
表示部18a および画像メモリ22a に供給される。画像メ
モリ22a には、書込みイネーブル時に画像データを書き
込む(ステップS10 )。
【0039】次に表セルの抽出処理を行う(ステップS1
2 )。この表セルの抽出に際してオペレータは、表示部
18に表示される画像を見ながら、たとえば帳票の読取り
を行う範囲を操作部12を用いて指定する。システム制御
部14は、この範囲指定に応じた画像データを画像メモリ
22a から表セル抽出部20に読み出す。表セル抽出部20
は、供給された画像データからデータの罫線を検出す
る。さらに、検出した罫線の交点の座標を求める。4つ
の交点が囲む領域が表セルに対応する。これら4つの点
を一組に表セルの抽出したデータとして抽出データ記憶
部220cに格納する。
【0040】次に表構造の照合処理を行う(サブルーチ
ンSUB1)。システム制御部14は、読取属性記憶部22b か
ら表構造を示す基準データとして読取属性(表構造、表
構造パラメータ)を表セル照合部24に供給する。この供
給は、たとえば、オペレータが一つ毎に選択した探索項
目に関して行われる。また、システム制御部14は、抽出
データ記憶部220cから座標データの表セル照合部24への
供給制御をデータ記憶部22および表セル照合部24に対し
て行う。
【0041】表セル照合部24では上述した供給されるデ
ータを参照して対応する表構造のパターンとの照合を行
う。すなわち、ここでの照合はセル構造判定機能部24b
において表構造パラメータで表される表セルの行および
列方向の並び、および/または表セルの個数が座標デー
タに基づいて得られる列方向の表セルの並びの関係と一
致するかどうかで行われる。さらに、決定した列方向の
表セルの並びに着目してキー項目セルとデータセルとの
領域を判定する。これらの判定結果は、セル構造判定機
能部24b に一時的に記憶させておいてもよいし、データ
処理記憶部22cに新たな記憶部を設けて記憶させてもよ
い。これにより、表セルと読取属性との対応がとれた情
報が得られる。
【0042】そして、すべての項目についてのチェック
が完了したか判定する(ステップS22 )。ここでは、た
とえば列方向のチェックを行うとともに、行方向に配さ
れているキー項目のチェックも行う。すなわち、図5に
示す帳票42の場合、振込先を表す「銀行名」、「支店
名」、・・・・、「金額」と示されたキー項目すべてがチェ
ック済みかどうかを判断する。まだ済んでいないとき
(NO)、サブルーチンSUB1に戻って、処理を繰り返す。
また、帳票42のチェックがすべて済んでいるとき(YES
)、認識処理に進む(ステップS24 )。
【0043】認識処理は、確定した表構造のパターンに
対応した罫線を除いた画像データから表セルの座標デー
タおよびその読取属性を用いて、データセルすべてに対
する文字認識処理を行う。この認識は、認識部26に格納
されているデータと表セル内の画像データとをたとえ
ば、パターン認識することで文字の同定を行う。得られ
た結果は、認識部26からシステムバス28を介して認識デ
ータ記憶部222cに供給する。具体的な処理手順を示して
いないが連続して同じ形式の帳票が供給され、画像入力
されているとき、供給される画像データに対してこの認
識処理を繰り返す。また、帳票の供給がなくなったと
き、この認識処理を終了に進め、一連の処理を終了させ
る。
【0044】このように動作させることで、複雑な表構
造を有する帳票が供給されても表構造を判別してこの判
定に応じた表セルの文字認識を自動的に行うことができ
るようになる。
【0045】さらにこの処理を実現させるために用いる
サブルーチンSUB1について簡単に説明する。この処理
は、表セルが列方向にどのように展開しているか判別す
る手順と、その手順により得られた関係から表構造パタ
ーンを推定し、決定する手順を説明している。まず、抽
出した表セルを列方向に2つ読み出す。この表セルの読
出しにより計8個の座標データが読み出される(サブス
テップSS10)。このとき読み出される表セルは、たとえ
ば図7に示す3種類のセルC1, C2, C3の大きさに分類さ
れる。セルC1は、3種類のうち、点a, b, c, dで規定さ
れる最も大きい表セルである。セルC2は、点e, f, g, h
で表され、高さがセルC1と同じで幅がセルC1より短い。
セルC3は、点p, q, r, sで表され、高さも幅もセルC1よ
り小さい。
【0046】次に読み出した表セルが近傍にあって、特
に8点のうち、ほぼ近傍の点が1組あるかどうか判定す
る(サブステップSS12)。たとえば、2つの表セルの座
標データが読み出された場合、一方の表セルが他方の表
セルの列方向にあって、近傍に一組の点があると判定さ
れるとき(YES )、サブステップSS14に進む。これは点
c と点e の組または点d と点f の組が一致すると判定す
る。また、一方の表セルが他方の表セルの列方向にあっ
て、近傍に二組の点があると判定される場合(NO)、た
とえば、セルC1とセルC2の座標データが点c と点e の組
および点d と点f の組の二組がセルC1とセルC2が同じ幅
を有すると判断してサブステップSS16に進む。サブステ
ップSS16では、判定結果が図3の構造パターン32である
ことを示すデータを帳票の画像に対して付す。
【0047】サブステップSS14では、一方の表セルの幅
より読み出した他方の表セルが小さいか判定する。他方
の表セルが小さいとき(YES )、一つの探索項目の表セ
ルの下に複数の表セルが存在する可能性を示している。
そこで、この可能性を探るために他方の表セルに対して
行方向の座標データを読み出す(サブステップSS18)。
【0048】読み出した座標データのうち、一端点が一
方の表セルの端点近傍かどうかを判定する(サブステッ
プSS20)。たとえば、点d と点f が近傍の一組となって
いるかを判断する。これらの端点が一致すると、一列下
に位置する表セルがいくつあるか知ることができる。す
なわち、ただちに一致すれば2個表セルが存在すること
がわかる。また、端点が一致しなかった場合(NO)、再
び行方向に位置する表セルの座標データを読み出す。一
致するまでこの戻った回数を歩進し、この回数に1を加
えると、表セルの個数が得られる。
【0049】次に得られた行内の表セルの探索項目にお
いて、キー項目の領域が、左にあるのかを判定する(サ
ブステップSS22)。この判定は、対応する表セルの読取
属性を確認することによって明らかになる。左端の表セ
ルにキー項目がある場合(YES )、図3の構造パターン
34と判定する(サブステップSS24)。サブステップSS24
では、構造パターン34を示すデータを帳票の画像に対し
て付す。また、表セルが2個あって左端の表セルにキー
項目がなく、対応する表セルの読取属性から確認された
とき(NO)、右端側の表セルにキー項目があると判定す
る(サブステップSS26)。サブステップSS26では、図3
の構造パターン36を示すデータを帳票の画像に対して付
す。
【0050】サブステップSS14において、たとえば、一
方の表セルよりも他方の表セルの幅があるとき(NO)、
行方向に位置する表セルの座標データを読み出す(サブ
ステップSS28)。読み出した座標データから得られる高
さが一方の表セルの範囲内にあるかどうか判定する(サ
ブステップSS30)。この判定において、他方の表セルの
高さが範囲内にあるとき(YES )、一つの探索項目の表
セルの横に複数の表セルが存在する可能性を示してい
る。この可能性を確認するため読み出した座標データの
うち、たとえば左の下端点と一方の表セルの右下端点が
近傍かどうかを判定する(サブステップSS32)。たとえ
ば、点h と点r が近傍の一組となっているかを判断す
る。最初のルーチンではサブステップSS30の結果から明
らかなように不一致になるので(NO)サブステップSS28
に戻る。
【0051】一方、サブステップSS30で、左の下端点と
一方の表セルの右下端点が近傍または一致した場合(N
O)、図3の構造パターン38と判定する(サブステップS
S34)。サブステップSS34では、構造パターン38を示す
データを帳票の画像に対して付す。
【0052】また、前述したサブステップSS32で、下端
点が一致すると、横に表セルがありこの横の表セルの列
方向に表セルがさらにいくつあることがわかる。この場
合、サブステップSS28に戻る回数がそのまま表セルの個
数を表す。この一致が2回目に得られる場合が図3に示
す構造パターン40である(サブステップSS36)。サブス
テップSS36では、構造パターン40を示すデータを帳票の
画像に対して付す。
【0053】このようにして構造パターンを判定した
後、すべてリターンに移行する。この判定結果を基に以
後の文字認識処理を継続する。この表構造を自動的に認
識することにより、オペレータの操作を簡素化させるこ
とができ、負担軽減を図っている。
【0054】次にOCR システム10の第1の変形例を説明
する(図8を参照)。この変形例は、前述した実施例の
構成に加えて、認識部26に項目判定機能部26b を含んで
いる。項目判定機能部26b は、表セルのうち、キー項目
セルに含まれる帳票イメージを認識して得られた文字の
読取属性と辞書220 に含む読取属性の文字とを比較し、
一致しているかどうかの判定を行う機能を有している。
【0055】このOCR システム10の動作は前述した処理
手順で動作する中で、図9に示すようにサブルーチンSU
B1の表構造の照合処理を行った後に、新たにステップS1
6 を加える。ここでは、キー項目セルに対して文字認識
処理を行う。詳細に手順を図示しないが、表構造パター
ンの決定が行われることによって、各表セルと読取属性
との関係が対応付けられている。この状況の下で、まず
認識部26ではキー項目セルだけの文字認識を行う。認識
して得られた文字と辞書220 に含まれる読取属性の文字
とを比較判定する。両者の文字が一致した場合、表構造
パターンの判定が正しかったと判定して以後の認識処理
を行う。また、文字の比較結果が不一致の場合、表構造
パターンの決定に誤りがあるものと判定して表セルと読
取属性との対応関係のデータを消去する。この判定によ
り、システム制御部14は探索項目におけるキー項目セル
およびデータセルがなかった旨を、たとえば表示部18に
表示させる。
【0056】この後、前述したと同様にすべての探索項
目に対してキー項目の認識処理が行われたかをステップ
S22 で判定し、まだ未探索項目がある場合、サブルーチ
ンSUB1に戻って処理を繰り返す。処理時間の短縮化を図
る上でも一つのキー項目でも不一致が検出された場合、
対応する表構造パターンがないと判断して処理を終了さ
せてもよい。また、すべての探索項目に対してこの検索
および認識処理を施して一致率を求め、もっともらしい
パターンに対応させながら、不一致部分に対してオペレ
ータが操作する方法を用いても従来よりも操作性を向上
させ、フレキシビリティの高い文字認識を行わせること
ができるようになる。
【0057】次にOCR システム10の第2の変形例を説明
する(図10を参照)。この変形例は、前述した実施例の
構成に加えて、表セル照合部24にパラメータ解析機能部
24cを含んでいる。パラメータ解析機能部24c は、解析
結果をセル構造判定機能部24b に供給して表セル構造を
判定の迅速化および正確さの向上の一助として用いる。
パラメータ解析機能部24c には、一つの探索項目に対し
て、読取属性記憶部22b からたとえば、図11に示す表構
造パターンP1〜P5をあらかじめ書式化して登録しておい
た表構造パラメータが供給される。すなわち、この書式
化した表構造パターンは、オペレータが扱い易い形式で
記述された表構造記述言語とも言える。パラメータ解析
機能部24c は、供給された表構造パラメータに対してセ
ル構造判定機能部24b で扱える内部データに変換する機
能を有している。ここで変換した内部データは、書式化
した表構造パターンに対して表セル照合部24が扱い易い
データになっている。この変換した内部データは、再び
読取属性記憶部22b に格納される。
【0058】この表構造記述言語を用いて表した表構造
の例について簡単に説明する。なお、各表セルとの対応
を表すために「A 」、「B 」、「C 」を用いているがこ
れらの表セルを区別する記号は実際の記述において不要
である。表構造パターンP1は一つの探索項目を記号
“[A] ”で表している。表構造パターンP2は探索項目が
二つ左右に隣接していることを記号“[A][B]”で表して
いる。また、同じ二つの探索項目でも上下に隣接してい
る場合は表構造パターンP3を記号“[A]/[B] ”で表され
る。さらにパターンP2とP3を組み合わせたような表セル
が複合構造をとる場合、記号“{}”で囲む。すなわ
ち、個々の表セルの組合せを一つの表セルとみなすこと
ができる。このような例に関して図11の表構造パターン
P4は記号“[A]{[B]/[C] }”で、表構造パターンP5は
記号“[A]/{[B][C]}”で表される。
【0059】この表構造記述言語を図3の表構造パター
ンに適用して記述する。記号の囲み内には便宜上、キー
項目・データの記述を入れている。また、データセルは
列方向に連続しているので、この連続していることを表
す記号には、記号“+”を用いている。表構造パターン
32は“[ キー項目] {/[データ ]}+”、表構造パター
ン34は“{[]/ {[ キー項目][] }}{/[データ][] }
+”、表構造パターン36は“{[]/ {[][ キー項目]
}}{/[][データ] }+”、表構造パターン40は
“{[ キー項目] {[]/[] }}{/[データ ]}+”とそ
れぞれ、表される。
【0060】なお、表構造記述言語に用いる記号は、上
述した記号に限定されるものでなく、これらの関係に一
貫性を持たせられる記号であれば何でもよい。また、記
号“+”を用いる代わりに他の記号を用いるとともに、
連続した表セルの回数を指定する方法でもよい。
【0061】この構成を加えた際の動作に着目して説明
すると、図12に示すように、表セルの抽出(ステップS1
2 )後にパラメータ解析処理を行う(ステップS14 )。
パラメータ解析処理は、一つの探索項目に対してオペレ
ータが登録しておいた表構造パラメータを読み込んで変
換し、内部データの生成を行う。表構造パターンを示す
生成した内部データは、たとえば、読取属性記憶部22b
に格納される。
【0062】サブルーチンSUB1では、図示しないがこの
場合、読取属性記憶部22b から格納している表構造パラ
メータ(内部データ)と、抽出データ記憶部220cから抽
出した表セルの領域座標とをそれぞれ読み出して表セル
照合部24に供給する。
【0063】セル構造判定機能部24b では、座標領域か
ら表構造を推定した前述のサブルーチンSUB1の場合に比
べて表セルの行方向および列方向の並び方、表セルの個
数を踏まえて表構造を特定することができる。これによ
り、先の実施例の場合より高い精度での表構造の特定が
できるとともに、オペレータによる表構造言語に基づく
データ登録を容易に行うことができ、このデータをパラ
メータ解析機能部24cにて変換し、格納したデータ(表
構造パラメータ)をセル構造判定機能部24b で用いるこ
とにより、帳票の構造がどのように複雑になっても柔軟
に対応することもできるようになる。
【0064】セル構造判定機能部24b で決定した表セル
の領域座標およびその読取属性を読取属性記憶部22b に
供給し、格納する。これらの判定結果は表セル照合部24
に一時的に格納してもよい。以後の処理は前述したと同
じ処理手順を経て文字認識を行う。
【0065】これにより、表構造パラメータのパターン
に対応した追加・変更が容易になり、探索項目ごとの条
件設定等が行えるようになる。各種の表構造に対応して
表セル照合ができるので、オペレータの作業、特に読取
属性の設定作業を軽減することができる。そして、処理
時間の短縮化も図ることができる。
【0066】次にOCR システム10の第3の変形例を説明
する(図13を参照)。この変形例は、前述した第2の変
形例の構成に加えて、データ記憶部22に関連情報記憶部
22eを含んでいる。関連情報記憶部22e は、一つの探索
項目に対して調べることにより隣接する探索項目(表セ
ル)が従属性のある項目か、独立性の探索項目かを判定
して各探索項目を特定するための情報を格納した記憶部
である。この記憶部は、項目と辞書、各項目同士とのリ
ンクを対応よく情報が得られるように格納されている。
【0067】この関連性について適用する業種等に応じ
て、たとえば帳票の項目に関連性のある項目と関連のな
い項目に分けることができる。具体的に、再び銀行の例
に基づいて説明する(図14を参照)。図14(a) に示すよ
うに、探索項目が「振込先」となっている場合、一般的
に、この振込先に関連してその振込先の銀行とその支店
を特定するため銀行名および支店名がつながりとして帳
票に現れる。このような場合、キー項目「振込先」は探
索項目「銀行名」および「支店名」と従属関連項目を持
つという。表構造記述言語で表すと、“{[ キー項目
(振込先)] {[銀行名]/[ 支店名] }}{/[データ]
}+”となる。
【0068】また、図14(b) に示すように、探索項目が
「小計件数」と「小計金額」と並列併記する場合があ
る。ともに小計に関連しているが、探索項目の扱う次元
が件数と金額、たとえば「円」、「ドル」等と異なる単
位で表されることから、この場合、両者の項目は、互い
に独立関連項目にあるという。独立関連項目には、従属
関連項目と区別できるようにたとえば、探索項目名の前
に記号“&”を付ける。記号“&”は、内部データにも
読取属性として表構造パラメータの一部として格納され
る。表構造記述言語で表すと、“{[ キー項目(小計件
数)][&小計金額] }/ {[ データ][] }”となる。
【0069】この第3の変形例は、第2の変形例に関連
項目の認識処理(ステップS18 )を加えた処理手順で処
理される。第3の変形例における処理手順の主要な点に
ついて説明する(図15を参照)。図15のパラメータ解析
処理(ステップS14 )でオペレータの操作により加えら
れる書式に表構造記述言語の記号“&”の有無に応じて
表セルの読取属性に従属関連項目か独立関連項目かの情
報も解析結果(表構造パラメータ)として抽出データ記
憶部220cまたは図示しない表セル読取属性記憶部に格納
する。
【0070】以後、表構造の照合処理(サブルーチンSU
B1)、キー項目の認識処理(ステップS16 )を行った
後、関連項目の認識処理(ステップS18 )に進む。関連
項目の認識処理は、認識部26での帳票イメージ上の座標
および読取属性から探索項目に関する文字認識した結果
と関連項目記憶部22e のキー項目辞書に含まれる単語と
を比較する。キー項目辞書は、各キー項目の単語辞書と
するとよい。そして各辞書は項目のリンクを張ることで
効率よい検索を行うことができる。
【0071】文字認識と辞書の単語が一致した場合、抽
出データ記憶部220cまたは図示しない表セル読取属性記
憶部に正しいと判断して認識結果をそのまま格納する。
また、比較した結果が不一致、すなわち正しくなかった
場合、抽出データ記憶部220cまたは図示しない表セル読
取属性記憶部に格納していたデータを消去する。これに
より、探索項目に関するキー項目セルとデータセルは見
つからなかったと判断する。ステップS14 〜S22 までの
処理を繰り返して探索項目すべてを調べる。たとえば、
最初に探索項目のデータセルの表構造が正しいと判断さ
れている場合、以後の探索項目に関連項目が含まれてい
るから、関連項目に対する解析は不要になる。不要な探
索項目に対するパラメータ解析は回避することができ
る。これにより、処理時間の短縮化を図る。また、不要
な探索項目とパラメータ解析が行われる探索項目とを区
別するため、不要な探索項目に探索済みのフラグを立て
る。
【0072】一方、独立関連項目に対しても上述した従
属関連項目と同様のパラメータ解析を行って探索項目に
おけるデータセルの抽出が正しいかどうかを比較判定す
る。このとき、独立関連項目は互いに関連するデータを
含んでいないので、独立関連項目は逐次選択されること
になる。選択した探索項目にはパラメータ解析、表構造
の照合、キー項目の認識の処理が順次施される。すべて
の探索項目にこの一連の処理が施される。この後、キー
項目セルおよびデータセルの帳票イメージに対する認識
処理が施される(ステップS22 )。
【0073】このように関連項目の認識処理を施すこと
により、読取項目の関連性と、表構造上のキー項目の位
置を記述するだけでなく、表構造だけでは特定できない
読取項目を正確に特定することができるようになる。し
たがって、正確な読取項目の特定が可能になることによ
り、オペレータの作業軽減および読取確度の向上にとも
なって全体の処理に要したこれまでの時間の長期化も回
避することもできる。
【0074】次にOCR システム10の第4の変形例を説明
する(図16を参照)。この変形例は、前述した第3の変
形例の構成に加えて、認識部26に読取属性文字判定機能
部26c を含んでいる。前述した第3の変形例において、
従属関連項目に対する確度の向上させる処理について述
べたが、第4の変形例では、たとえば図14(b) や図17
(a) と図17(b) とを区別して互いに独立した探索項目
(独立関連項目)の確度向上を目的に構成する。
【0075】読取属性文字判定機能部26c は項目判定機
能部26b からの判定結果を受けて探索項目、特にデータ
セルに含まれる文字とキー項目対応の辞書から読み出し
た文字とを比較して読み取った文字が読み出した単語そ
のものか、および/またはその文字にこの単語が一部と
して含んでいるかの判定を行う機能を有している。アク
セスするキー項目対応の辞書は、たとえば図1に示す読
取属性記憶部22b に含まれる辞書220 である。また、こ
のような辞書は、別に設けてもよい。
【0076】次に第4の変形例の動作を説明する。第4
の実施例は、第3の変形例にデータセル認識処理(ステ
ップS20 )を加えた処理手順で処理される。第4の変形
例における処理手順の主要な点について説明する(図18
を参照)。データセル認識処理では、データセルを認識
し、単語の照合を行う。図17(a), (b)に示すように独立
関連項目の記号{}内の複合セルの表構造は同じであ
る。すなわち、表構造記述言語で表すと、図17(a) の表
構造は、記号{&[]/[] }{&[]/[] }であり、図17
(b) の表構造は、記号{&[][]}/ {&[][]}である。
各表セルに対するチェックとしては、ステップS16 でキ
ー項目セルに対する確認が行われているが、データセル
に対しては行われていない。この結果、対応するデータ
セルは正確に独立関連項目における表セルかどうか不明
確である。これは独立関連項目の探索項目に限定される
問題でなく、データセルの認識に関わって生じる問題で
ある。そこで、このような表構造におけるデータセルの
認識を高めるためにデータセル認識処理では、表構造記
述言語の記号「%」を用いてデータセルの認識を行うと
ともに、抽出データ記憶部220cまたは図示しない表セル
読取属性記憶部に格納していたデータ(座標,読取属
性)を用いて、一つのデータセルのイメージに対して文
字認識処理(単語照合)を施す。この具体例として図17
を用いて説明する。
【0077】図17(a) では、探索項目が小計件数の場合
を表構造記述言語で表すと、{[キー項目(小計件数)]}
{[%データ]}{[&小計金額] /[]} となり、探索項目が
小計金額の場合、 {[ &小計金額] /[]}{[ キー項目
(小計件数)]}{[%データ]}となる。また、図17(b) の
ように探索項目が小計件数の場合では、{[キー項目(小
計件数)][%データ]}/{[&小計金額] []} となり、探
索項目が小計金額の場合、 {[ &小計金額][]}/{[キー
項目(小計件数)][%データ]}となる。したがって、表
構造の不明確さを防ぎ、的確に表構造を認識することが
できる。
【0078】さらに、得られた文字列に対して単語照合
を行って、この文字列にデータセルの読取属性の単語が
含まれている場合、キー項目セルおよびデータセルの抽
出が正しいと判定する。この正しい判定の場合、システ
ム制御部14は、抽出データ記憶部220cまたは図示しない
表セル読取属性記憶部のデータをそのまま格納してお
く。
【0079】また、得られた文字列に対して単語照合し
た際にデータセルの読取属性の単語が含んでいない場
合、キー項目セルおよびデータセルの抽出が正しくな
く、対応するキー項目セルとデータセルが見つからなか
ったと判定する。この判定により、システム制御部14
は、抽出データ記憶部220cまたは図示しない表セル読取
属性記憶部のデータを消去する。したがって、似た表構
造が存在しても判定することができる。
【0080】ただし、前述において例示したような銀行
名等のデータセルが複数ある場合、実際にデータセル認
識を行うと、処理速度が遅くなる。処理速度を優先させ
る場合、データセル認識処理の実行には注意を要する。
【0081】このようにデータセルに認識処理を施すこ
とにより、ある特定の単語を含むデータセルがあれば、
単に表構造、キー項目認識の処理、および関連項目認識
の情報だけで特定できない探索項目のデータセルを特定
できるようになる。これにより、より一層の正確な読取
項目の特定が可能になることにより、オペレータの作業
軽減および読取確度の向上にともなって全体の処理に要
する処理時間を短縮化することもできる。
【0082】なお、データセル認識処理において、文字
認識にかかる時間を短縮化するようにあらかじめ通常の
文字認識か対象とする文字コードだけでなく、データセ
ル単位の文字コードを単語辞書として用意し、サブセッ
ト的な文字認識を行わせるようにしてもよい。
【0083】また、これまで表セルの領域を示す座標を
用いて表セルの照合等を説明したが、表セルの整列処
理、すなわち表セルの並び方を考慮して表構造を特定す
る方法を適用しても表セルの照合を行わせることができ
る。読取属性にキー項目単語、データセル単語辞書等の
個々に詳細区分された辞書を持たなくても表構造パラメ
ータまたは書式化した表構造パラメータを用いて表照合
および文字認識ができることは言うまでもない。
【0084】
【発明の効果】このように本発明の文字読取装置によれ
ば、座標検出手段で検出した座標に基づいて各表セルの
大きさ(幅、高さ)の情報を用いて、登録された表セル
の読取属性を表す構造パラメータのいずれに対応するか
構造判定機能ブロックで判定して表セルの照合を行うこ
とにより、読み込んだ画像データに含まれる表構造を自
動的に認識することができるので、オペレータの負担を
軽減するとともに、その作業効率、特に処理時間の大幅
な短縮化を図ることができる。
【0085】また、本発明の文字認識方法によれば、画
像データの中から罫線の交点に対応する座標検出によっ
て検出した座標に基づいて表示セルの照合を行う中で、
照合工程は、座標から表示セルの幅および高さをそれぞ
れ求め、これら得られた情報が登録された表セルの読取
属性を表す構造パラメータのいずれに対応するか判定を
行うことにより、読み込んだ画像データに含まれる表構
造を自動的に認識するので、オペレータの負担を軽減す
るとともに、その作業効率、特に処理時間の大幅な短縮
化を図るだけでなく、この表構造の認識により表セルの
読取りにおける精度も向上させることができる。
【図面の簡単な説明】
【図1】本発明に係る文字読取装置を適用したOCR シス
テムの概略的な構成を示すブロック図である。
【図2】図1のOCR システムにおいて用いる読取属性の
一例を示す図である。
【図3】図1のOCR システムにおいて用いる構造パター
ンの例を示す図である。
【図4】図1のOCR システムにおける文字認識の処理手
順を説明するフローチャートである。
【図5】図1のOCR システムに読み込まれる帳票の一例
を示す図である。
【図6】図4の処理手順に用いるサブルーチンSUB1の表
構造照合の手順を説明するフローチャートである。
【図7】図5の帳票に用いた各種の表セルの大きさの例
を示す図である。
【図8】図1のOCR システムの第1の変形例の概略的な
構成を示すブロック図である。
【図9】図8のOCR システムの動作手順を説明するフロ
ーチャートである。
【図10】図8のOCR システムに構成を追加した第2の
変形例の概略的な構成を示すブロック図である。
【図11】OCR システムが扱う表セルおよび組み合わせ
た表構造パターンの例を示す図である。
【図12】図10のOCR システムの動作手順を説明するフ
ローチャートである。
【図13】図10のOCR システムに構成を追加した第3の
変形例の概略的な構成を示すブロック図である。
【図14】図13のOCR システムが扱う表セルにおける従
属関連項目と独立関連項目の例を示す図である。
【図15】図13のOCR システムの動作手順を説明するフ
ローチャートである。
【図16】図13のOCR システムに構成を追加した第4の
変形例の概略的な構成を示すブロック図である。
【図17】OCR システムで用いる複合セルの構造が同じ
表構造を有する例を示す図である。
【図18】図16のOCR システムの動作手順を説明するフ
ローチャートである。
【符号の説明】
10 OCR(光学文字読取)システム 12 操作部 14 システム制御部 16 画像入力部 18 表示部 20 表セル抽出部 22 データ記憶部 24 表セル照合部 26 認識部 28 システムバス 22a 画像メモリ 22b 読取属性記憶部 22c 処理データ記憶部
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平11−175654(JP,A) 特開 平5−20494(JP,A) 特開 平10−134120(JP,A) 特開 平6−131497(JP,A) 特開 平7−114616(JP,A) 特開 平1−147786(JP,A) 特開 昭61−59568(JP,A) 特開 昭63−155386(JP,A) 特開 平7−56900(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/82

Claims (10)

    (57)【特許請求の範囲】
  1. 【請求項1】 情報記録媒体に記録された情報を画像デ
    ータとして読み込む情報入力手段と、得られた画像デー
    タに含まれる罫線が囲む領域を表セルとし、該表セルを
    規定する座標を検出する座標検出手段と、該検出した座
    標の該当する表セルに含まれる文字の認識を行う認識手
    段と、得られた画像データと読み取った結果を記憶する
    記憶手段とを備えた文字読取装置において、該装置は、前記表セルの並び方を表すパラメータの記述を解析する
    パラメータ解析機能ブロックと、 該解析したパラメータのうち、前記表セルの内容を表す
    項目セルの一つに対する列方向への連続するパラメータ
    を考慮しながら、 前記座標検出手段で検出した座標から
    表示セルの幅および高さを求め、求めた幅および高さが
    登録された表セルの読取属性を表す構造パラメータに対
    応するか判定を行う構造判定機能ブロックを含み、前
    表セルの照合を行う照合手段を含むことを特徴とする
    文字読取装置。
  2. 【請求項2】 請求項1に記載の装置において、前記認
    識手段は、読み取った情報と前記表セルの読取属性に対
    応したキーとなる項目の単語が含まれる辞書との照合を
    行い、前記情報と前記項目の一致性を判定する項目判定
    機能ブロックを含み、 前記記憶手段には、前記表セルの読取属性に関するデー
    タを格納した辞書が含まれていることを特徴とする文字
    読取装置。
  3. 【請求項3】 請求項1に記載の装置において、前記照
    合手段は、前記パラメータ解析機能ブロックにて指定さ
    れた連続する表セルの回数を解析することを特徴とする
    文字読取装置。
  4. 【請求項4】 請求項2に記載の装置において、前記記
    憶手段には、前記表セルの読取属性の独立または従属を
    示す関連情報と前記キーとなる項目とを結び付けて記憶
    する関連情報記憶手段が含まれることを特徴とする文字
    読取装置。
  5. 【請求項5】 請求項2に記載の装置において、前記認
    識手段には、前記表セルの読取属性に対応した文字が複
    数の表セルにそれぞれあるかどうかを判定する文字判定
    機能ブロックが含まれることを特徴とする文字読取装
    置。
  6. 【請求項6】 情報記録媒体に記録された情報を画像デ
    ータとして読み込む画像入力工程と、該画像入力工程で
    得られた画像データに含まれる罫線が囲む領域を表セル
    とし、該表セルを規定する座標を検出する座標検出工程
    と、該座標検出工程で検出した座標を基に該当する表セ
    ルに含まれる文字を認識する認識工程とを備えた文字認
    識方法において、該方法は、 前記座標検出によって検出した座標に基づいて表示セル
    の照合を行う照合工程を含み、 前記照合工程は、前記表セルの並び方を表すパラメータ
    の記述を解析するパラメータ解析工程と、 該解析したパラメータのうち、前記表セルの内容を表す
    項目セルの一つに対する列方向への連続するパラメータ
    を考慮して、 前記座標から前記表示セルの幅および高さ
    をそれぞれ求め、求めた幅および高さが登録された表セ
    ルの読取属性を表す構造パラメータに対応するか判定を
    行う構造判定工程を含むことを特徴とする文字認識方
    法。
  7. 【請求項7】 請求項6に記載の方法において、前記表
    セルの読取属性に対応したキーとなる項目の単語を含む
    辞書を用意し、 該辞書の項目の単語と前記表セルから読み取った情報と
    の照合を行い、前記情報と前記項目の一致性を判定する
    項目認識工程を含み、 前記項目認識工程は、前記照合工程の後に行うことを特
    徴とする文字認識方法。
  8. 【請求項8】 請求項6または7に記載の方法におい
    て、前記照合工程は、指定された連続する表セルの回数
    解析することを特徴とする文字読取方法。
  9. 【請求項9】 請求項6または8に記載の方法におい
    て、 前記表セルの読取属性の独立または従属を示す関
    連情報と前記キーとなる項目とを結び付けて記憶する関
    連情報記憶手段を用意し、 前記表セルからそれぞれ読み出したキーとなる項目の単
    語と前記関連情報記憶手段が有する項目と対応させて各
    表セルの関連性を調べる関連調査工程を含むことを特徴
    とする文字認識方法。
  10. 【請求項10】 請求項6または9に記載の方法におい
    て、前記認識工程の前に、前記表セルの読取属性に対応
    した文字が複数の表セルにそれぞれあるかどうかを判定
    する文字判定工程を含むことを特徴とする文字認識方
    法。
JP28282999A 1999-10-04 1999-10-04 文字読取装置および文字認識方法 Expired - Fee Related JP3435374B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP28282999A JP3435374B2 (ja) 1999-10-04 1999-10-04 文字読取装置および文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP28282999A JP3435374B2 (ja) 1999-10-04 1999-10-04 文字読取装置および文字認識方法

Publications (2)

Publication Number Publication Date
JP2001101340A JP2001101340A (ja) 2001-04-13
JP3435374B2 true JP3435374B2 (ja) 2003-08-11

Family

ID=17657630

Family Applications (1)

Application Number Title Priority Date Filing Date
JP28282999A Expired - Fee Related JP3435374B2 (ja) 1999-10-04 1999-10-04 文字読取装置および文字認識方法

Country Status (1)

Country Link
JP (1) JP3435374B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106709489A (zh) * 2015-07-13 2017-05-24 腾讯科技(深圳)有限公司 一种字符识别的处理方法和装置

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008108114A (ja) * 2006-10-26 2008-05-08 Just Syst Corp 文書処理装置および文書処理方法
JP5810568B2 (ja) * 2011-03-17 2015-11-11 富士通株式会社 情報処理装置、プログラム、およびデータの抽出方法
JP2017220266A (ja) * 2017-09-21 2017-12-14 株式会社東芝 帳票読取装置、プログラムおよび帳票読取方法
JP7263721B2 (ja) * 2018-09-25 2023-04-25 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
JP2020160649A (ja) * 2019-03-26 2020-10-01 株式会社日立情報通信エンジニアリング 画像処理装置、画像処理方法及び画像処理プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106709489A (zh) * 2015-07-13 2017-05-24 腾讯科技(深圳)有限公司 一种字符识别的处理方法和装置
CN106709489B (zh) * 2015-07-13 2020-03-03 腾讯科技(深圳)有限公司 一种字符识别的处理方法和装置

Also Published As

Publication number Publication date
JP2001101340A (ja) 2001-04-13

Similar Documents

Publication Publication Date Title
US8270721B2 (en) Method and system for acquiring data from machine-readable documents
JP4347677B2 (ja) 帳票ocrプログラム、方法及び装置
EP0285449B1 (en) Document processing system
US5265242A (en) Document retrieval system for displaying document image data with inputted bibliographic items and character string selected from multiple character candidates
US6567546B1 (en) Data medium handling apparatus medium handling method
US5867596A (en) Method for diagram recognition by using recognizing rules and system for implementing the method
JP4996940B2 (ja) 帳票認識装置およびそのプログラム
JPH06111056A (ja) 文書書式のデジタル・イメージの文字認識誤りを修復するデータ処理システム及び方法
JP3435374B2 (ja) 文字読取装置および文字認識方法
JP5227120B2 (ja) 文字列認識装置及び方法、並びにプログラム
JP4347675B2 (ja) 帳票ocrプログラム、方法及び装置
Blomqvist et al. Reading the ransom: Methodological advancements in extracting the swedish wealth tax of 1571
JP5134383B2 (ja) Ocr装置、証跡管理装置及び証跡管理システム
JP4853313B2 (ja) 文字認識装置
JPH1173472A (ja) フォーマット情報登録方法及びocrシステム
JPH11219394A (ja) 財務諸表自動入力装置
KR102561878B1 (ko) 머신러닝 기반의 ai 블루 ocr 판독 시스템 및 판독 방법
KR102673900B1 (ko) 표 데이터 추출 시스템 및 그 방법
JP4442136B2 (ja) 文字認識方法および装置
JP2001312694A (ja) 多種類の帳票認識方法および装置
JP3160458B2 (ja) 文字読取装置及び文字読取方法
KR20240003662A (ko) 컨텐츠검출장치 및 컨텐츠 검출 방법
JP2003099709A (ja) 誤読文字修正方法及び光学的文字認識装置
JP3929560B2 (ja) 誤記自動修正方法、読取装置、および誤記自動修正プログラムを記録したコンピュータ読み取り可能な記憶媒体
KR20240099705A (ko) 구조식 이미지 정보를 이용한 검색방법 및 시스템

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030430

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080530

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090530

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100530

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100530

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110530

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120530

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130530

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140530

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees