JP3186712B2 - 文書読取装置 - Google Patents

文書読取装置

Info

Publication number
JP3186712B2
JP3186712B2 JP30498798A JP30498798A JP3186712B2 JP 3186712 B2 JP3186712 B2 JP 3186712B2 JP 30498798 A JP30498798 A JP 30498798A JP 30498798 A JP30498798 A JP 30498798A JP 3186712 B2 JP3186712 B2 JP 3186712B2
Authority
JP
Japan
Prior art keywords
document
input
image
character line
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP30498798A
Other languages
English (en)
Other versions
JPH11219408A (ja
Inventor
勝美 丸川
和樹 中島
昌史 古賀
好博 嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP30498798A priority Critical patent/JP3186712B2/ja
Publication of JPH11219408A publication Critical patent/JPH11219408A/ja
Application granted granted Critical
Publication of JP3186712B2 publication Critical patent/JP3186712B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文書読取装置および電
子ファイル装置およびファクシミリ装置および複写機お
よび計算機に入力する紙の文書を電子的なデータに変換
する装置に関し、特に、予め決まっているスキャナ(走
査線)の読み取り方向(移動方向)に対し、ユーザがこ
の方向を意識せず、紙の文書をスキャナ上に0度から3
60度までのどのような角度で設定しても、文書に記載
されている内容を読み取ったり、あるいは、正しい方向
に入力画像を修正したりする等のユーザの使い勝手を改
善した文書読取装置および電子ファイル装置およびファ
クシミリ装置および複写機および計算機に関する。
【0002】
【従来の技術】元来、スキャナの読み取り方向と文書の
スキャナ上への設定方向が一致した状態でのみ、文書中
に記載された内容が読み取れる文書読取装置が知られて
いる。しかしながら、近年、文書読取装置が実現される
に及んで、文書が傾いて入力されたり、それと同時にス
キャナの読み取り方向と文書のスキャナ上への設定方向
が不一致であるという設定状態の不十分な場合において
も入力文書の読み取りを行なわなければならない状況が
発生している。
【0003】上記の問題を解決する従来例としては、特
開昭62−14277号公報、特開平2−105266
号公報がある。
【0004】特開昭62−14277号公報に開示の装
置では、画像から輪郭抽出を行ない、抽出された輪郭か
ら罫線などの直線部分の傾きを抽出して、この直線部分
の傾きが水平(あるいは垂直)になるように傾きを補正
することにより、画像の傾きを補正可能とする。
【0005】特開平2−105266号公報に開示の装
置では、黒画素計数手段により計数した計数結果を比較
しその結果により入力されている文書画像を回転させる
ことにより、文書画像の上下関係の自動修正を図る。
【0006】
【発明が解決しようとする課題】しかし、上記の従来の
装置では、上下関係が一致して傾いている状態(傾きが
0〜90度)、あるいは、入力文書に傾きがなく上下関
係が異なっていた状態(傾きが180度)しか文書に記
載された内容を読み取ることができない。
【0007】つまり、上記の従来の装置では、スキャナ
の設定方向に対し任意の角度(0度から360度)回転
されて入力された場合、その内容を読み取ることができ
なかったり、正しい方向に入力画像を修正しユーザに画
像を提示できない等のユーザの使い勝手を考慮した機能
を持っていなかった。
【0008】これは、図3に示すように、A3スキャナ
2300の走査線が移動する方向2310と文書を設定
する領域2320はあらかじめ決まっている。そのた
め、従来の装置ではシステムが処理する方向はスキャナ
の走査線が移動する方向と一致していなければ処理でき
ない。
【0009】したがって、処理できる許容範囲として
は、図4に示すように、文書2400の上下関係が一致
して多少傾いたもの、あるいは、図5に示すように、文
書2500に傾きが無く上下関係が反転したものであっ
た。図6に示すように、文書2600が90度あるいは
180度あるいは270度の回転に加えて傾きもある場
合、従来のシステムでは文書中に記載された内容を読み
取れなかったし、入力画像を修正しユーザに提示する機
能等を持っていなかった。
【0010】ここで、回転角とはスキャナの読み取り方
向と文書の上下方向が指示する方向との角度の差として
定義する。これは、読み取り方向に90度傾いた方向(図
5では右から左へのベクトル方向)と文書の左右方向
(図5では文書の右から左へのベクトル方向)との角度
の差と同一であり、図5では文書の上下関係の概念を考
慮すると回転角は180度である。
【0011】また、上記の装置では、ユーザが間違えて
文書の裏面を入力した場合とか、文書の読み取るべき部
分がスキャナの読み取り領域からはみ出した場合の検出
あるいはそのような文書の処理方法等のユーザの使い勝
手を考慮した機能を持っていない。
【0012】また、上記の装置では、文書に記載されて
いない文書に関わる著者、入手先、入手日時、メモ等の
付加情報を入力文書に関する情報に関連付けて入力した
り、文書間同志の関係を持たせる機能が無いため、文書
に記載されていない情報を登録することも検索すること
もできず、また、関連のある他の文書の情報から所望の
文書に関わる情報を検索することができない等のユーザ
の使い勝手を考慮した機能を持っていない。
【0013】さらに、上記装置では、データ登録時での
ファイル容量のチェック機能、大量に蓄積・管理された
画像データに対しての読み取り機能、画像回転修正機
能、あるいは、文字認識時での外字処理機能等のユーザ
の使い勝手を考慮していない。
【0014】以上のように、従来の装置ではユーザにと
って使い勝手が悪いと言う問題点があった。
【0015】そこで、本発明の第1の目的は、文書がス
キャナの設定方向に対し任意の角度(0度から360
度)で回転されて入力された場合でも、その内容を読み
取ることができたり、あるいは、正しい方向に入力画像
を修正しユーザに提示する機能等のユーザの使い勝手を
考慮した文書読取装置あるいは電子ファイル装置あるい
はファクシミリ装置あるいは複写機あるいは計算機を提
供することにある。
【0016】また、本発明の第2の目的は、ユーザが間
違えて文書の裏面を入力した場合とか、文書の読み取る
べき部分がスキャナの読み取り領域からはみ出した場合
の検出、そのような文書の処理方法そしてユーザが再度
文書の設定を行うこと無く自動的にはみ出し領域の内容
を含め読み取る等のユーザの使い勝手を考慮した文書読
取装置あるいは電子ファイル装置あるいはファクシミリ
あるいは複写機あるいは計算機を提供することにある。
【0017】また、本発明の第3の目的は、文書に記載
されていない文書に関わる著者、入手先、入手日時、メ
モ等の付加情報の登録や検索をするができ、また、関連
のある他の文書の情報から所望の文書に関わる情報を検
索できる等のユーザの使い勝手を考慮した機能を持った
文書読取装置あるいは電子ファイル装置あるいはファク
シミリ装置あるいは複写機あるいは計算機を提供するこ
とにある。
【0018】さらに、本発明の第4の目的は、データ登
録時でのファイル容量のチェック機能、大量に蓄積・管
理された画像データに対しての読み取り機能、画像回転
修正機能、あるいは、文字認識時での外字処理機能等の
ユーザの使い勝手を考慮した文書読取装置あるいは電子
ファイル装置あるいはファクシミリ装置あるいは複写機
あるいは計算機を提供することにある。
【0019】
【課題を解決するための手段】上記の第1の目的を達成
するために、文書画像を入力する手段と、入力された文
書画像の文字行を抽出する手段と、文書の傾きを抽出す
る手段と、上記の抽出された文字行を文書の傾きに0
度、90度、180度、270度を加えた角度回転させ
る手段と、回転された4つの文字行をそれぞれ認識を行
ない、その中で最も正しいものの回転角を文書の傾きと
して画像を補正する。
【0020】第2の目的を達成するために、上記の文書
画像の文字行を抽出する手段で、文字行が抽出されない
場合は、文書が裏側で入力されたと判定する手段を備え
た。
【0021】また、任意の位置にある文字行を抽出する
手段により得られた文字行の4つの頂点の2頂点以上が
スキャナ読み取り領域の4辺上に存在するか否かに従い
読み取るべき文字行がスキャナ読み取り領域外にあるか
否かを判定する手段を備えた。
【0022】また、A4スキャナ読み取り領域において
上記手段によりはみ出していると判定した場合、新たに
A3スキャナで文書画像を採取することで自動的にはみ
出し領域であった内容も含め文書中の記載内容を漏らさ
ず読み取る手段とを備えた。
【0023】さらに、入力に不備があったと判定された
文書画像の文書番号をリジェクトファイルに登録する手
段や、エラーメッセージのウインド上への表示あるいは
音声での呼び掛けによる警告を行う手段とを備えても良
い。
【0024】第3の目的を達成するために、入力された
文書画像に文書番号を登録する手段と、文書に関わる入
手日時や目的や入手先等の文書に書かれていない付加情
報を入力するための付加情報入力する手段と、入力され
た付加情報を文書番号や入力文書を処理した文書情報に
対応付けて電子的に記録する手段と、付加情報や文書情
報を検索する手段とを備えた。
【0025】また、文書同志の関係情報を電子的に記録
する手段と、文書同志の関係情報を検索して所望の文書
についての文書情報や付加情報を検索する手段とを備え
ても良い。
【0026】第4の目的を達成するために、本発明は、
入力文書画像の処理結果をファイルに出力するための空
き容量を表示する手段と、空き容量が少なくなった場合
には警告をウインドウ上への表示あるいは音声で行う
段あるいはネットワークを介しオペレータがいる他の装
置に警告を行う手段とを具備したことを特徴とする文書
読取装置あるいは電子ファイル装置あるいはファクシミ
リ装置あるいは複写機あるいは計算機を提供する。
【0027】また、複数枚の文書をスキャナ入力した文
書画像をデータ蓄積装置に格納する手段と、格納時に文
書番号を付加する手段と、格納された文書画像を逐次ロ
ードし画像回転修正あるいは読み取り処理を行う手段と
を備えた。
【0028】さらに、文書をディジタル画像として入力
する装置の読み取り処理において、認識対象文字コード
がシステム側に存在しない場合、文字画像を外字として
辞書に登録する手段や、登録された記号を読み取り結果
として割り当てて表示あるいはファイルに出力する手段
を備えても良い。
【0029】
【作用】上記の構成により、文書画像中の任意の位置に
ある文字行を抽出し、スキャナ設定方向に対する文書画
像の傾きを抽出し、スキャナ設定方向に対する文書画像
の回転角を求めるための適切な文字行を選択し、適切な
文字行の部分画像を検出した傾きに4種類の角度0度、
90度、180度、270度を加えた角度だけそれぞれ
回転し、4種類のそれぞれの回転文字行部分画像から部
分画像中の文字を切り出し認識し入力文書画像のスキャ
ナ設定方向に対する回転角を評価する手段あるいはこの
手段に入力文書のレイアウト情報を用いて入力文書画像
のスキャナ設定方向に対する回転角を評価し、求められ
た文書の回転角だけ入力画像を回転修正することがで
き、従来不可能であった任意の回転角で入力された文書
をユーザが見やすいようにディスプレイ上に表示あるい
は蓄積出来、ユーザのデータ操作の使い勝手をはるかに
向上できる。また、回転修正画像に対して文字行を抽出
し直して記載された内容を読み取る手段あるいは求めた
回転角だけ文字行部分画像を回転修正しレイアウト情報
を利用することで回転修正文字行画像を処理する順番を
求め記載された内容を順次読み取ることで、従来不可能
であった任意の回転角で入力された文書中に記載された
文字画像のコード化が可能となり、オートフィーダー等
を用いた自動登録やユーザがマニュアルでデータ入力す
る際の再入力が不要になるため、入力作業の高効率化が
実現可能となる。
【0030】また、求めた回転角だけ入力画像を修正回
転し、修正画像を順次蓄積でき、ユーザはスキャナ入力
方向を意識せず文書画像の登録作業を行うことが出来
る。また、文書入力はスキャナのカバーを用いて行うた
め、雑誌等の見開き文書の入力作業は1頁おきにスキャ
ナのカーバーが邪魔になり入力作業が困難であった。し
かし、文書の回転角を判定し画像を修正・蓄積するた
め、ユーザは文書の設定方向を全く意識せずに気楽に文
書を反転させてでも入力することが出来るため、入力作
業の高効率化が実現可能となる。
【0031】文書画像から抽出した文字行の有無に従
い、入力文書が表で正常に入力されたものか間違えて裏
で入力されたものかを自動的に判定することが出来るた
め、ユーザにエラーを指示することができ、入力作業の
効率化を実現できる。また、入力不備の文書番号をリジ
ェクトファイルに登録するため、マニュアルでのデータ
入力やオートフィダー等を用いた自動登録時に、入力状
況のチェックができ、目視等による人間の確認作業を大
幅に削減できる。
【0032】また、システムが任意の位置にある文字行
を抽出する手段により得られた文字行の4つの頂点の2
頂点以上がスキャナ読み取り領域の4辺上に存在するか
否かに従い、読み取るべき文字行がスキャナ読み取り領
域外にあるか否かを判定することが出来るため、ユーザ
にエラーを指示することができ、入力作業の効率化を実
現できる。また、入力不備の文書番号をリジェクトファ
イルに登録するため、マニュアルでのデータ入力やオー
トフィダー等を用いた自動登録時に、入力状況のチェッ
クができ、目視等による人間の確認作業を大幅に削減で
きる。
【0033】また、上記手段により入力文書がA4スキ
ャナ読み取り領域をはみ出していることがわかった場
合、新たにA3スキャナで文書画像を採取し、これに対
し読み取り処理を行うことにより、ユーザが目視により
はみ出しを確認する必要がなく、かつ、文書を再設定し
て再度読み取り処理を行わなくてもシステムが自動的に
文書中の記載内容を漏らすこと無く読み取ることが出
来、入力作業の効率化を実現できる。
【0034】また、システムが入力に不備があったと判
定した場合、エラーメッセージのウインド上への表示あ
るいは音声での呼び掛けによる警告を行うことで、ユー
ザにエラーを指示することが出来るため、入力作業の効
率化を実現できる。
【0035】さらに、入力された文書画像に文書番号を
登録し、ユーザは文書に関わる著者、入手日時、入手先
うあメモ等の文書に書かれていない付加情報を入力する
ための付加情報入力し、入力された付加情報を文書番号
や入力文書を処理した文書情報に対応付けて電子的に記
録するため、ユーザは付加情報や文書情報を指定して、
対応する付加情報や文書情報を検索手段より効率良く検
索し、容易に情報を取り出すことが出来る。
【0036】また、文書同志の関係情報を電子的に記録
するため、ユーザは検索手段により文書同志関係情報を
容易に検索して、ある文書から他の文書をたぐり、その
文書についての文書情報や付加情報を取り出すことがで
き、ユーザのおぼろげな記憶からでも他の文書に関する
情報を用いて所望の情報を入手することが出来る。
【0037】入力文書画像の処理結果をファイルに出力
するための空き容量を表示し、空き容量が少なくなった
場合には警告をウインド上への表示あるいは音声で行っ
たり、あるいは、ネットワークを介しオペレータがいる
他の装置に警告を行うことにより、入力作業のやり直し
やシステムへの弊害を回避することが出来る。
【0038】また、複数枚の文書をスキャナ入力した文
書画像をデータ蓄積装置に格納し、格納時に文書番号を
付加し、格納された文書画像を逐次ロードし読み取り処
理あるいは画像回転修正を行うことで、大量に入力され
た文書画像に対して文書に関する情報を管理しながら文
字画像をコード化でき、ユーザの修正作業を削減でき
る。
【0039】さらに、文書をディジタル画像として入力
する装置の読み取り処理において、認識対象文字コード
がシステム側に存在しない場合、文字画像を外字として
辞書に登録し、ある記号を登録した外字の読み取り結果
として割り当てて表示あるいはファイルに出力すること
で、システムに存在しない認識不可文字が入力されても
対処できる。また、意味不明な認識結果を出力せず、ユ
ーザが容易に読み取り結果を処理することができ、読み
取り精度を向上させる。
【0040】
【実施例】以下、図に示す実施例により本発明を詳細に
説明する。なお、これにより本発明が限定されるもので
はない。
【0041】図2は本発明の一実施例の文書読取装置の
構成図である。
【0042】この文書読取装置はCPU2110と、主
メモリ2120と、画像メモリ2130と、CRT21
40と、キーボード2150と、マウス2160と、ス
キャナ制御部2170と、スキャナ2180と、データ
蓄積部2190と、磁気ディスク2200と、光ディス
ク2210と、光磁気ディスク2220と、プリントア
ウト装置2230と、スピーカ2240と、バス225
0とから構成される。
【0043】図1は本発明の文書読取装置の一実施例の
ブロック図である。
【0044】画像入力手段105は前記スキャナ210
8とスキャナ制御部2170とCPU2110と画像メ
モリ2130から構成され、文書101を読み取って文
書画像を得て、これを一時的に記憶し、これをCRT2
55に表示する。
【0045】文字行抽出手段110は前記CPU211
0から構成され、画像メモリ2130上に記憶された文
書画像から文書中の文字行を抽出する。この文字行抽出
方法は、例えば、特開昭62−165284号公報に開
示されている。
【0046】表裏判定手段115は前記CPU2110
から構成され、前記文字行抽出手段110の結果を用い
て、入力された文書101が間違えて裏面で入力されて
いないかどうかを判定する。裏面で入力されたと判定さ
れた場合、リジェクト警告手段245に信号を送り、こ
の手段245が入出力制御手段250を介してCRT2
55上への表示あるいはスピーカ280を用いて、ユー
ザに裏面入力警告を行う。また、リジェクト登録手段2
05により、文書番号登録手段195で付加された文書
番号をリジェクトファイル210に登録する。
【0047】はみ出し判定手段120は前記CPU21
10から構成され、前記文字行抽出手段110の結果を
用いて、入力された文書画像がスキャナ2108の読み
取り領域をはみ出しているかどうかを判定する。読み取
り領域をはみ出したと判定された場合、リジェクト警告
手段245に信号を送り、この手段245が入出力制御
手段250を介してCRT255上への表示あるいはス
ピーカ280を用いて、ユーザにはみ出し入力警告を
。また、リジェクト登録手段205により、文書番号
登録手段195で付加された文書番号をリジェクトファ
イル210に登録する。
【0048】傾き抽出手段125は前記CPU2110
から構成され、画像メモリ2130上に記憶された文書
画像から入力文書の傾きを抽出する。この傾き抽出方法
は、例えば、特開昭62−14277号公報に開示され
ている。
【0049】最適文字行選択手段130は前記CPU2
110から構成され、文字認識ベース回転角評価手段1
45での評価用文字行として高い精度でかつ高速な処理
を実現するため、前記文字行抽出手段110により得ら
れた文字行から最適な複数個の文字行を選択する。
【0050】文字行画像回転手段140は前記CPU2
110から構成され、最適文字行選択手段130により
選択された複数個の文字行の画像を4種類の回転角、す
なわち、傾き抽出手段125により得られた傾きに0度
あるいは90度あるいは180度あるい270度加えた
回転角だけ回転する。
【0051】文字認識ベース回転角評価手段145は前
記CPU2110から構成され、最適文字行選択手段1
30により選択された複数個の文字行を文字行画像回転
手段140により4種類の回転角で回転した回転文字行
画像に対し、それぞれの回転文字行画像に対し文字切り
出しおよび文字認識を行い文字認識結果の類似度を用い
て、4種類の回転角の評価を行う。
【0052】また、文書の回転角の判定を高精度に求め
るため、文書のレイアウト情報を文字認識ベース回転角
評価手段145の結果に加えて利用する方法について説
明する。
【0053】文字行座標回転手段165は前記CPU2
110から構成され、文字行抽出手段110により得ら
れた文字行の座標を4種類の回転角、すなわち、傾き抽
出手段125により得られた傾きに0度あるいは90度
あるいは180度あるい270度加えて考慮した回転角
だけ回転する。
【0054】レイアウト情報抽出手段170は前記CP
U2110から構成され、前記文字行座標回転手段16
5により得た4種類の回転角で回転させて得た文字行座
標に対しレイアウト情報を抽出する。このレイアウト情
報抽出方法は、例えば、特開平1−130293号公報
に開示されている。
【0055】レイアウトベース回転角評価手段175は
前記CPU2110から構成され、レイアウト知識18
0とレイアウト情報抽出手段170で抽出した4種類の
回転角での回転させて得たレイアウト情報を用いて評価
を行う。
【0056】文書回転角判定手段150は前記CPU2
110から構成され、文字認識ベース回転角評価手段1
45、あるいは、この手段とレイアウトベース回転角評
価手段175で得られたそれぞれの4種類の回転角での
評価結果を基にして入力文書の回転角を判定する。この
判定手段により、回転角の判定結果が曖昧であった場
合、リジェクト警告手段245に信号を送り、この手段
245が入出力制御手段250を介してCRT255上
への表示あるいはスピーカ280を用いて、ユーザに回
転角判定不可の警告を行う。また、リジェクト登録手段
205により、文書番号登録手段195で付加された文
書番号をリジェクトファイル210に登録する。
【0057】画像回転手段155は前記CPU2110
から構成され、画像メモリ2130上に記憶された文書
画像を文書回転角判定手段150により得られた回転角
だけ回転する。
【0058】読取手段160は前記CPU2110から
構成され、画像回転手段155により回転角だけ回転さ
れた修正文書画像に対して、修正画像中の文字画像を文
字コードに変換する。
【0059】読取結果修正手段240は前記CPU21
10から構成され、入出力制御手段250を介して、読
取手段160で処理した内容に対し、CRT255に読
み取り結果や修正結果を表示したり、キーボード260
あるいはマウス265を用いて読み取り結果の修正を行
う。
【0060】文書番号登録手段195は前記CPU21
10から構成され、入力文書101に対し文書番号を付
け、文書番号ファイル200に文書番号を登録する。
【0061】入力画像登録手段185は前記CPU21
10から構成され、文書番号登録手段195によりつけ
られた文書番号と共に画像メモリ2130上に記憶され
た入力文書画像を入力画像ファイル190に登録する。
【0062】修正画像登録手段215は前記CPU21
10から構成され、画像回転手段155により修正され
た修正文書画像を文書番号と共に修正画像ファイル22
0に登録する。
【0063】読取結果登録手段225は前記CPU21
10から構成され、読取手段160により読み取られた
結果を文書番号と共に読取結果ファイル230に登録す
る。
【0064】付加情報登録手段275は前記CPU21
10から構成され、スキャナ2180から入力した情報
ではなく、キーボード260あるいはマウス265から
入力した情報を付加、あるいは、関連づけて管理する。
そして、キーボード260あるいはマウス265等のス
キャナ2180以外から入力した情報を付加情報ファイ
ル270に登録する。
【0065】ファイル制御手段235は前記CPU21
10から構成され、上記述べたような複数個のファイル
の登録・管理、あるいは、これらファイル間での情報を
関連づける。そして、複数個のファイル間に対し同一文
書での情報同志および異文書間同志での情報の関係を用
いて管理する。
【0066】上記ファイル群はデータ蓄積部2190を
介して磁気ディスク2200あるいは光ディスク221
0あるいは光磁気ディスク2230に格納される。
【0067】次に、本システムの大まかな処理の流れに
ついて図7を用いて説明する。
【0068】
【0069】まず、画像入力2700にて紙の文書デー
タを電子的な画像データに変換する。そして、文書番号
登録2705にて変換された文書画像に文書番号を付加
する。そして、文書画像登録2710にて文書画像を登
録する。そして、文字行抽出2715にて文書画像中に
存在する文字行を抽出する。そして、表裏判定2735
にて文字行の有無に従い入力文書が間違えて裏面を入力
されたものか否かを判定する。そして、リジェクト判定
2740にて入力文書をリジェクトすべき否かを判定す
る。そして、もしリジェクトする場合、リジェクト警告
2745そして文書番号をリジェクト登録2750す
る。そして、はみ出し判定2755にて入力文書がスキ
ャナの読み取り領域をはみ出しているか否かを判定す
る。そして、リジェクト判定2760にて入力文書をリ
ジェクトすべき否かを判定する。そして、もしリジェク
トする場合、リジェクト警告2765そして文書番号を
リジェクト登録2770する。そして、傾き検出277
2にてスキャナ読み取り領域での水平線と入力文書水平
線との角度の差である傾きを検出する。そして、最適文
字行選択2774にて入力文書の回転角を求める文字認
識ベース回転角評価2778で評価対象とする最適な文
字行を複数個選択する。そして、文字行画像回転277
6にて選択した複数個の文字行画像を抽出した傾きに0
度、90度、180度、、270度を加えた4種類の回
転角だけ回転する。そして、文字認識ベース回転角評価
2778にてそれぞれの回転角で回転させた文字行画像
から文字を切り出し、認識させ、その時の類似度により
4種類の回転角の評価を行う。そして、レイアウト解析
評価実行2780にて文字認識ベース回転角評価277
8にレイアウト情報を用いた回転角の評価を加えるか否
かにより分岐する。もしレイアウト情報を用いた回転角
の評価も加味させる場合、文字行座標回転2782にて
文字行座標を抽出した傾きに0度、90度、180
度、、270度を加えた4種類の回転角だけ回転する。
そして、レイアウト情報抽出2784にて4種類の回転
角での文字行座標からレイアウト情報を抽出する。そし
て、レイアウトベース回転角評価8655にてそれぞれ
の回転角でのレイアウト情報とレイアウト知識を用いて
回転角の評価を行う。そして、文書回転角判定2779
にて先に求めた文字認識ベース回転角評価結果あるいは
これとレイアウトベース回転角評価結果から入力文書の
回転角を判定する。そして、もし画像回転が必要か否か
を画像回転判定2790にて判定し、もし画像回転が必
要な場合には画像回転2792にて判定した回転角を用
いて文書画像を回転する。そして、回転した修正画像を
登録する(2794)。そして、読み取り2796にて
回転した修正画像中の文字画像を文字コードへと変換す
る。そして、読み取り結果を登録(2798)し、ユー
ザの指示に従って読み取り結果の修正(2799)を行
う。
【0070】次に、入力画像から抽出した文字行の有無
に従い入力文書が表で正常に入力されたものか間違えて
裏で入力されたものかを判定する方法について説明す
る。
【0071】図9に示すように、まず、文字行を抽出す
る(900)。そして、文字行が存在するか否かを判定
する(910)。もし裏面が入力された場合、入力文書
は白紙であるため、文字行が抽出されないので文字行が
存在しない。すなわち、文字行が存在すれば次処理を実
行し(920)、文字行が存在しなければ裏面で入力さ
れたものと判定しリジェクト処理を実行する(93
0)。リジェクト処理では、ユーザにリジェクト入力で
あることを警告するかあるいはリジェクト文書としてそ
の文書番号をリジェクト文書番号ファイルに登録する。
【0072】次に、読み取るべき文字行がスキャナ読み
取り領域外にあるか否かを判定する方法について説明す
る。
【0073】図10に示すように、まず、スキャナ読み
取り領域をはみ出したか否かを示すはみ出しフラグに
“0”をセットする(1000)。そして、文字行数
回、次の処理を繰り返す(1005)。はみ出し文字行
の回数を示すCOUNTを0にセットする(101
0)。そして、カレント文字行の頂点数である4回、次
の処理を繰り返す(1015)。1020でスキャナ読
み取り領域境界線である(*、0)上に注目している頂
点が存在するか否かを判定する。もし1020を満たせ
ばCOUNTをインクリメントとする(1025)。こ
こで、*は任意の数値であることを示す。そして、10
30でスキャナ読み取り領域境界線である(0、*)上
に注目している頂点が存在するか否かを判定する。もし
1030を満たせばCOUNTをインクリメントとする
(1035)。そして、1040でスキャナ読み取り領
域境界線である(Xe、*)上に注目している頂点が存
在するか否かを判定する。もし1040を満たせばCO
UNTをインクリメントとする(1045)。ここで、
Xeはスキャナ読み取り領域の最大X座標である。そし
て、1050でスキャナ読み取り領域境界線である
(*、Ye)上に注目している頂点が存在するか否かを
判定する。もし1050を満たせばCOUNTをインク
リメントとする(1055)。ここで、Yeはスキャナ
読み取り領域の最大Y座標である。そして、1060に
てCOUNTが2以上であるか否かを判定する。ここ
で、COUNTが2以上であるということは文字行がス
キャナの非読み取り領域にあり、入力文書がはみ出して
いることを示す。もし、COUNTが2以上ならばその
文字行の番号を登録する(1065)。そして、はみ出
しフラグを1にセットする(1070)。以上の処理が
終了して、はみ出しフラグが1でセットされているか否
かを判定する(1075)。そして、もし、はみ出しフ
ラグが1でセットされていれば、リジェクト処理を実行
する(1080)。
【0074】次に、はみ出し文字行が検出された場合の
画面表示について説明する。
【0075】図11に示すように、画面上1100に表
示されたウインド1110上に文字行が表示される。こ
の時、はみ出した文字行であることが容易に判り易いよ
うに、文字行がはみ出していないもの1120と文字行
がはみ出したもの1130の表示の色を違えて表示す
る。
【0076】次に、ユーザが入力文書の傾きを調整する
方法について説明する。
【0077】図12に示すように、画面上1200に表
示されたウインド1210上に文字行1220、傾きイ
ンディケータ1240、その初期位置1230、およ
び、傾きインディケータを操作するポインティングデバ
イス1250を表示する。この場合、入力画像として傾
きがあり、それに加えて180度回転した文書である。
そして、ユーザは中央部に表示された傾きインディケー
タを表示された文字行に直接重ねることが出来、容易に
かつ高精度に傾きを調節することが出来る。そして、調
節が完了したら、操作パネル1260上の終了ボタン1
270あるいはキャンセルボタン1280により処理を
終える。
【0078】次に、最適文字行選択手段130での文字
行の選択方法について説明する。
【0079】図8に示すように、まず、選択する文字行
のカウンタであるCOUNTの初期化を行う(80
0)。そして、カウンタCOUNTが選択文字行数に至
るまで、以下の処理を繰り返す(810)。カレント文
字行の縦横比あるいは横縦比がある一定値以上の場合
(820)、その文字行を最適文字行の一つとする(8
30)。そして、カウンタCOUNTをインクリメント
とする(840)。そして、選択文字行数に至った場合
(850)、最適文字行選択手段を終了する(86
0)。
【0080】次に、文字行画像回転手段140および文
字認識ベース回転角評価手段145について説明する。
【0081】まず、図13に示すように、最適文字行選
択手段130により選択された複数個の文字行の画像1
305と入力文書画像の傾き1300を4種類の回転処
理部(1315〜1325)に入力させ、各回転処理部
にて複数個の文字行の画像を(−a)度、(90−a)
度、(180−a)度、(270−a)度だけ回転させ
た文字行画像を得る。そして、1330において、各回
転角での文字行画像を対象に、文字切り出し(1335
〜1350)、文字認識(1355〜1370)を実行
する。そして、文字類似度評価処理部(1375〜13
90)にて、文字認識の類似度を用いそれぞれの回転角
での文字行画像に対する評価値を求める。ここで、文字
類似度評価処理部の評価関数としては全ての文字の類似
度の平均値あるいは中央値等が利用される。そして、最
良回転角判定部1397にて、各回転角で求められた評
価値から文書回転角1399を判定し、評価値が曖昧な
場合にはリジェクト情報1399を出力する。
【0082】次に、文字認識ベース回転角評価手段14
5の一実施例について説明する。
【0083】図14に示すように、入力文書の回転角を
判定する際、類似度による評価が曖昧な場合には対象文
書をリジェクト扱いにしようというものであり、まず、
得られた4種類の回転角での文字類似度評価値を入力す
る(1400)。そして、最良の評価値(a)を求め
(1410)、次点の評価値(b)を求める(142
0)。そして、a−bの絶対値がある値Kよりも大きい
か否かを判定する(1430)。もし条件を満足すれ
ば、文書の回転角を決定し(1440)、そうでない場
合にはリジェクト処理を行う(1450)。
【0084】次に、文字行座標回転手段165、レイア
ウト情報抽出手段170とレイアウトベース回転角評価
手段175について説明する。
【0085】まず、図15に示すように、入力文書画像
の傾き1500と最適文字行選択手段130により選択
された複数個の文字行の座標1505を4種類の回転処
理部(1510〜1525)に入力させ、各回転処理部
にて複数個の文字行の座標を(−a)度、(90−a)
度、(180−a)度、(270−a)度だけ回転させ
た文字行座標を得る。そして、レイアウト解析処理部
(1530〜1545)において、各回転角での文字行
座標からレイアウト解析を実行する。そして、レイアウ
ト照合部(1550〜1565)にて、レイアウト知識
(1570〜1585)を用い各回転角の評価値(15
90〜1597)を求める。
【0086】次に、予め入力文書の縦書き・横書き情報
がわかっている場合のレイアウト情報を用いた回転角の
評価方法について説明する。
【0087】まず、図16に示すように、図15の場合
と異なるのはレイアウト照合時に予めレイアウト情報が
わかっているためレイアウト情報信号(1699)をレ
イアウト照合部(1650〜1665)に入力させ、照
合させるレイアウト知識(1670〜1685)を限定
させるものである。
【0088】次に、レイアウト情報を照合させる方法に
ついて説明する。
【0089】文書は1つ以上の節(ブロック)から構成
され、図17に文書を構成するブロックが必ず持つ属性
の縦書き、横書き情報を0度、90度、180度、27
0度回転した時のイメージを示す。この図からわかるよ
うに、横書き・縦書きを各回転させたもののどれも文字
が始まる字下げ座標と中途で終了する文末の座標に特徴
があり、この特徴を用いて照合することで入力文書の回
転角を求めることが出来る。レイアウト知識内に図17
の(1)の(8)の情報を格納し、これとレイアウト解
析させて得られる図17の(1)から(8)のどのパタ
ンとが近いかを調べることで入力文書の回転角の識別が
可能になる。
【0090】次に、文字認識ベース回転角評価手段14
5の結果とレイアウトベース回転角評価手段175の結
果とを合わせた文書回転角の判定方法について説明す
る。
【0091】図18に示すように、文字認識ベース回転
角評価値(a)を求める(1800)。そして、レイア
ウトベース回転角評価値(b)を求める(1810)。
そして、文書回転各判定(1820)にて、値aとbが
等しい場合には回転角を決定し(1830)、読み取り
処理を行う(1840)。また、値が等しくない場合に
はリジェクト処理を実行する(1850)。
【0092】次に、求めた入力文書の回転角を用いて文
書画像中の文字画像を文字コードに変換する処理方法に
ついて説明する。
【0093】図19に示すように、文字行座標190
5、文書回転角1910と入力画像1915を画像回転
部1920に入力する。そして、画像回転部1920に
て文書回転角だけ入力文書を回転修正する。そして、文
字行抽出部にて新たに修正画像中から文字行を抽出す
る。そして、文字切出部1935にて文字を切り出し、
文字認識部1940にて文字認識を行い、文字コード1
955に変換し出力する。
【0094】次に、求めた入力文書の回転角とレイアウ
ト情報を用いて文書画像中の文字画像を文字コードに変
換する処理方法について説明する。
【0095】図20に示すように、文書回転角2110
と文字行部分画像2105を部分画像回転部2125に
入力する。そして、画像回転部にて文書回転角だけ入力
文書を回転修正する。また、文字行番号2114とレイ
アウト情報2115を読み順決定部2120に入力す
る。この読み順決定部2120で文字コードに変換して
いく文字行の順序求める。そして、回転文字行画像と読
み順情報を文字切出部2130に入力する。そして、読
み順決定部2120で得た順番に従い、文字切出部21
30にて文字を切り出し、文字認識部2135にて文字
認識を実行し、文字コード1955を出力する。
【0096】次に、自動的に入力文書の頁番号を読み取
り、これを付加情報として登録する方法について説明す
る。
【0097】図21に示すように、回転処理部2210
に回転角2200および入力画像2205を入力し文書
画像を回転修正する。そして、頁番号を認識するため
に、まず、頁番号を修正画像から抽出する必要から頁番
号レイアウト情報ファイル2220に格納されている知
識を用いて頁番号画像抽出部2215にて頁番号部分画
像を抽出する。次に、抽出した頁番号部分画像から頁番
号を一文字づつ文字切り出し部2225にて切り出し、
文字認識部2230にて画像データから文字コードに変
換する。最後に、認識した頁番号を付加情報として付加
情報登録部2235にてこれを付加情報ファイル224
0に登録する。
【0098】次に、登録される情報について説明する。
登録されるデータは文書番号、入力画像、リジェクト番
号、修正画像、読取結果そして付加情報がある。この付
加情報には、さらに、図22に示すように、文書名23
05、著者名1:2310、著者名2:2315、雑誌
名2320、入手先2325、入手日時2330等の情
報が登録され、同一文書同士内で関係情報が結び付けら
れる。そして、図23に示すようにファイル制御手段2
440が文書同士の関係を抽出し、文書同士関係ファイ
ル2445に登録する。
【0099】図24に、雑誌名に関する情報ファイルを
示す。このファイルには項目内容とその項目での文書番
号が登録されている。他の登録項目のファイルも同様な
構成である。文書同士関係を生成するファイル制御手段
は各登録項目のファイルの参照時に、同じ項目内容をも
つ文書番号は相互に関係があるものとし、文書番号から
順に関係のある文書番号をリスト化していく。これによ
り、図25の示す如き文書同士関係ファイルが作成され
ることになる。
【0100】以上述べたように、上記システムでは同一
文書内の情報の検索はもちろん、登録項目からの関連文
書の検索、また、ユーザが所望の文書に関する情報がお
ぼろげである場合でも、文書同士関係を用いて他の文書
からでも所望の文書に関する情報を入手することが出来
る。
【0101】次に、A4スキャナでの読み取り時に生じ
ることがある読み取り領域からの文書のはみ出しを解決
する方法を図27を用いて説明する。
【0102】電子ファイリング装置ではスキャナとして
A3読み取り可能のものが多く、文書をA4で入力する
のでは無く、A3の読み取り領域で入力し(280
0)、その後は図7で示した方法と同様な方法にて入力
文書画像中の内容を読み取る(2805−2870)。
ここで、図7と異なるのははみ出し判定が不必要になる
ことと、それに伴うリジェクト処理が不要になることで
ある。また、処理に関しては図7で示した処理領域を拡
張するのみで良いため容易に実現できる。
【0103】次に、先に示した方法では毎回A3読み取
り領域を処理するため処理時間がA4対応の場合に比べ
て掛かってしまう。そのため、まず、A4読み取り領域
で画像を入力して(2900)、はみ出し処理を行ない
(2905)、その結果に基づきはみ出し判定する(2
910)。はみ出した場合、A3読み取り領域で画像を
再入力し(2915)、図27で示した処理(2805
−2870)ここでは処理29を実行する(292
0)。また、読み取り領域を文書画像がはみ出していな
い場合、A4読み取り領域の画像に対して処理29を実
行する(2925)。以上述べた方法により、ユーザが
読み取りたい文書が読み取り領域をはみ出した場合、毎
回入力文書を整えて入力し直すこと無く、自動的に内容
を読み取ることが出来る。
【0104】次に、読み取るべき文字行がスキャナ読み
取り領域外にあるか否かを判定する方法について図29
を用いて説明する。
【0105】図10では文字行の4すみの座標により入
力文書が読み取り領域をはみ出したか否かを判定する方
法を示した。ここでは、もっと簡易な方法で入力文書が
読み取り領域をはみ出したか否かを判定する方法を示
す。図29は、入力画像(3000)に文字行(300
5)が存在しそれがスキャナ読み取り領域をはみ出して
いる図を示している。ここでは、上辺、底辺、左辺、右
辺に対しNビットの幅を持つ矩形(例えば、3010、
3015)に対し周辺分布あるいは累積黒ドット数を積
算する。入力文書が読み取り領域をはみ出した場合、必
ず4辺のどれかに接触するため4つのどれか一つ以上の
矩形の累積黒ドット数はある値Vを超える。図29の場
合、矩形3015の累積黒ドット数が値Vを超えてしま
う。このように、4辺の矩形中の累積黒ドット数の値を
調べることにより容易に入力文書が読み取り領域をはみ
出したか否かを判定することが出来る。
【0106】次に、読み取る入力文書の方向角を決定す
る際に文字認識の結果を利用するが、この時、文字画像
あるい文字行画像を任意の角度に回転させて文字認識を
行う必要がある。この回転の方法としてビットごとに回
転を行う方法が考えられるがこれは処理量が少なくは無
い、そのため、文字行画像中から文字画像を取り出し、
文字認識方法として文字の骨格あるいは輪郭を用いるも
のに対しては、文字の骨格あるいは輪郭を、例えば図3
1に示す8方向のチェーンコードで表現し、回転に必要
な角度だけチェーンコードの番号をずらすのみで処理量
を大幅に削減し容易に実現できる。回転角の文か伊能に
応じて16方向あるいは32方向と言うようにチェーン
コードの方向数を増せば容易に細かい角度での回転が行
える。例えば、「但」と言う文字の骨格データに対し8
方向のチェーンコードでこれを表現した図29に示す。
このように、骨格データを8方向のチェーンで表現で
き、容易に45度単位で回転が行える。
【0107】
【発明の効果】本発明の文書読取装置あるいは電子ファ
イル装置あるいはファクシミリあるいは複写機あるいは
計算機によれば、文書がスキャナの設定方向に対し任意
の角度(0度から360度)で回転されて入力された場
合でも、入力文書の回転角を検出し、正しい方向に入力
画像を修正し、その内容を読み取ることが出来る。ま
た、ユーザに修正した画像を提示あるいは蓄積すること
が出来る。
【0108】また、入力された文書がユーザが間違えて
裏面で入力されたものかを判定し、裏面入力時にはユー
ザにメッセージで警告することが出来る。また、入力さ
れた文書の読み取るべき部分がスキャナの読み取り領域
からはみ出しているかを判定し、はみ出して入力された
場合にはユーザにメッセージで警告することが出来る。
【0109】また、文書に記載されていない文書に関わ
る入手先、入手日時、メモ等の付加情報を入力画像やそ
の処理結果に対応づけて記録し、文書情報を指定して、
その文書に関連のある情報を検索し、取り出すことが出
来る。また、関連のある他の文書同志の関係情報を記録
し、その文書同志関係情報を検索して、ある文書からた
の文書をたぐり、所望の文書に関わる情報を検索し、取
り出すことが出来る。
【0110】また、入力文書がA4スキャナ読み取り領
域をはみ出しても、はみ出し領域を判定し再度A3スキ
ャナ読み取り領域で文書画像を自動的に入力することに
より、文書に記載された内容を漏らすこと無く読み取る
ことが出来る。
【0111】さらに、データ登録時にファイル容量をチ
ェックすることで、処理結果が格納か否かを判定し、ユ
ーザにメッセージで警告することが出来る。また、大量
な文書を入力し、入力画像の回転角を修正し、修正画像
を蓄積すると同時にその画像を管理することが出来る。
【0112】
【図面の簡単な説明】
【図1】本発明の文書読取装置の一実施例のブロック図
である。
【図2】本発明の文書読取装置の一実施例のブロック図
である。
【図3】スキャナの捜査線の方向とシステムの処理方向
を示した図である。
【図4】文書がスキャナ上に傾いて設定された状態を示
す図である。
【図5】文書がシステムの処理方向と反転して設定され
た状態を示す図である。
【図6】文書がシステムの処理方向と任意の回転角で設
定された状態を示す図である。
【図7】本発明の文書読取装置の大まかな処理の過程を
示した図である。
【図8】最適な文字行を選択するフローを示した図であ
る。
【図9】間違えて裏面で入力されたか否かを判定するフ
ローを示す図である。
【図10】スキャナの読み取り領域をはみ出したか否か
を判定するフローを示す図である。
【図11】スキャナの読み取り領域をはみ出した部分の
表示方法を示した図である。
【図12】入力文書の傾きをユーザが設定する方法を示
した図である。
【図13】文字認識を利用して文書の回転角の評価を示
す図である。
【図14】4種類の候補文書回転角から回転角を決定す
る方法を示す図である。
【図15】レイアウト情報を利用して文書の回転角の評
価を示す図である。
【図16】予め設定されたレイアウト情報を利用して文
書の回転角の評価を示す図である。
【図17】縦書き・横書きのブロックを0、90、18
0、270度回転させた図である。
【図18】文字認識を利用して求めた回転角とレイアウ
ト情報を利用して求めた回転角による文書の回転角の決
定方法を示す図である。
【図19】入力文書を回転角だけ修正し、記述された内
容の読み取りを示す図である。
【図20】入力文書をレイアウト情報を用いて、回転角
だけ修正し、記述された内容の読み取り方法を示す図で
ある。
【図21】文書画像を回転修正し頁番号を認識し、それ
を付加情報として登録する一実施例を示す図である。
【図22】付加情報として登録する内容の一例を示した
図である。
【図23】複数の項目のファイルから文書間同志の情報
を抽出し登録する方法を示す図である。
【図24】雑誌名情報ファイルの例示図である。
【図25】文書同志関係情報ファイルの例示例である。
【図26】本発明の文書読取装置の一実施例の処理フロ
ーを示した図である。
【図27】A3スキャナを用いることにより、A4スキ
ャナの読み取り領域からはみ出すことがない読み取りフ
ローを示す図である。
【図28】A4スキャナの読み取り領域からのはみ出し
を検出した場合、更にA3スキャナの読み取り領域で画
像入力することにより、読み取りを実現する処理フロー
を示す図である。
【図29】スキャナの読み取り領域をはみ出したか否か
を判定するフローを示す図である。
【図30】文字画像の回転を行なうこと無く、チェーン
コードにより文字認識対象を高速に回転する表現に用い
るチェーンコードを示す図である。
【図31】チェーンコードにより表現されたもの骨格を
示す図である。
【符号の説明】
101 文書、 105 画像入力手段、 110 文字行抽出手段、 125 傾き抽出手段、 150 文書回転角判定手段、 165 文字行座標回転手段。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 嶋 好博 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (56)参考文献 特開 平2−299084(JP,A) 特開 平4−68757(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/82

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】文書の画像を入力する入力手段と、上記入
    力された画像の文字行を抽出する文字行抽出手段と、該
    文字行抽出手段の出力である文字行の有無に従い、入力
    文書が表で正常に入力されたものか間違えて裏で入力さ
    れたものかを判定する手段とを有し、該判定手段により
    上記入力文書が裏で入力されたと判定された場合にはリ
    ジェクト処理を行うことを特徴とする文書読取装置。
  2. 【請求項2】文書の画像を入力する入力手段と、上記入
    力された画像の文字行を抽出する文字行抽出手段と、該
    文字行抽出手段の出力である文字行の有無に従い、入力
    文書が表で正常に入力されたものか間違えて裏で入力さ
    れたものかを判定する手段とを有し、該判定手段により
    文字行が存在すると判定された場合に、入力された文書
    の傾きを抽出する傾き抽出手段と、上記の抽出された文
    字行を文書の傾きに0度、90度、180度、270度
    を加えた角度を回転させる回転手段と、上記回転された
    4種類の文字行の認識を行ない、認識から文書の傾きを
    判定する判定手段とを備え、上記文書の傾きを補正して
    読み取りを行なうことを特徴とする文書読取装置。
JP30498798A 1998-10-27 1998-10-27 文書読取装置 Expired - Fee Related JP3186712B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP30498798A JP3186712B2 (ja) 1998-10-27 1998-10-27 文書読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP30498798A JP3186712B2 (ja) 1998-10-27 1998-10-27 文書読取装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP25435492A Division JP3186246B2 (ja) 1992-09-24 1992-09-24 文書読取装置

Publications (2)

Publication Number Publication Date
JPH11219408A JPH11219408A (ja) 1999-08-10
JP3186712B2 true JP3186712B2 (ja) 2001-07-11

Family

ID=17939716

Family Applications (1)

Application Number Title Priority Date Filing Date
JP30498798A Expired - Fee Related JP3186712B2 (ja) 1998-10-27 1998-10-27 文書読取装置

Country Status (1)

Country Link
JP (1) JP3186712B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4571039B2 (ja) * 2005-07-28 2010-10-27 株式会社リコー 情報処理装置、情報処理方法及びプログラム
CN110138992A (zh) 2018-02-08 2019-08-16 精工爱普生株式会社 收据处理装置、程序的存储介质以及报告的制作方法

Also Published As

Publication number Publication date
JPH11219408A (ja) 1999-08-10

Similar Documents

Publication Publication Date Title
EP0738987B1 (en) Processing machine readable forms
US5799115A (en) Image filing apparatus and method
US5201011A (en) Method and apparatus for image hand markup detection using morphological techniques
JP3805005B2 (ja) 画像処理装置及び光学的文字認識装置及びそれらの方法
Yanikoglu et al. Pink Panther: a complete environment for ground-truthing and benchmarking document page segmentation
US5539841A (en) Method for comparing image sections to determine similarity therebetween
US6356655B1 (en) Apparatus and method of bitmap image processing, storage medium storing an image processing program
JP3113827B2 (ja) 矩形オブジェクトの認識方法及び認識装置
US6614929B1 (en) Apparatus and method of detecting character writing area in document, and document format generating apparatus
US6711292B2 (en) Block selection of table features
JPH0420226B2 (ja)
US6947596B2 (en) Character recognition method, program and recording medium
JP3186246B2 (ja) 文書読取装置
JPH03214378A (ja) 文字認識装置
US20010043742A1 (en) Communication document detector
JP3186712B2 (ja) 文書読取装置
JP3558493B2 (ja) 用紙位置合わせ装置、用紙位置合わせ方法及び用紙位置合わせプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3442847B2 (ja) 文字読取装置
JPH09319824A (ja) 帳票認識方法
US7110600B1 (en) Document identifying device and method
JP2581353B2 (ja) グラフ画像登録システム
JP3406942B2 (ja) 画像処理装置及び方法
JPH0689330A (ja) 画像ファイリングシステム
JP3345246B2 (ja) 文字認識装置及び文字認識方法
JP2755299B2 (ja) 画像処理方法

Legal Events

Date Code Title Description
S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080511

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090511

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100511

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110511

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110511

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120511

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees