JPH08329186A - 文書読取装置 - Google Patents

文書読取装置

Info

Publication number
JPH08329186A
JPH08329186A JP7135419A JP13541995A JPH08329186A JP H08329186 A JPH08329186 A JP H08329186A JP 7135419 A JP7135419 A JP 7135419A JP 13541995 A JP13541995 A JP 13541995A JP H08329186 A JPH08329186 A JP H08329186A
Authority
JP
Japan
Prior art keywords
correction
data
character
recognition
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7135419A
Other languages
English (en)
Inventor
Tetsuo Nakamura
哲夫 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP7135419A priority Critical patent/JPH08329186A/ja
Publication of JPH08329186A publication Critical patent/JPH08329186A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 オペレータの修正する文字数を減らすことを
目的とする。 【構成】 オペレータが修正した文字の認識データから
その修正に際して必要なデータを抽出することにより修
正データを作成する修正データ作成部9と、この修正デ
ータ作成部9で作成した修正データを格納する修正メモ
リ8と、この修正メモリ8に格納した修正データと文字
の認識データとを順次比較することにより1処理単位に
相当する認識データ内を探索して、オペレータが修正し
た文字と同様な誤り文字を探索する探索部10と、この
探索部10で探索した同様な誤り文字をオペレータが修
正したのと同様の文字に修正する修正部11とを有する
文書読取装置1とした。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、媒体である文書上に記
載された文字,図形,絵,写真や罫線等のイメージ情報
を読み取り、記憶してある認識データに従ってそのイメ
ージ情報を認識し、その認識結果をオペレータが確認し
て認識誤りに対して修正を施すことができる文書読取装
置に関する。
【0002】
【従来の技術】従来の文書読取装置では、媒体である文
書上に記載された文字,図形,絵,写真や罫線等のイメ
ージ情報を読み取って、そのイメージ情報から文字情報
を認識して認識データとして記憶し、その認識データを
オペレータが確認して認識誤りに対して修正を施した後
に、その修正と同様の修正を施す必要がある修正対象を
探索して修正をする同様誤り一括修正処理を施すように
していた。その同様誤り一括修正処理では、オペレータ
が一頁の一箇所を修正する毎に、その都度、対象頁中を
探索して自動的に修正するようにしていた。
【0003】また、その修正対象の探索は、例えば、特
開平4−199483号公報や特開平5−20492号
公報等に記載のものがある。特開平4−199483号
公報に記載のものは、候補文字と確信度とから同様文字
か否かを判断して修正対象を認識し、また、特開平5−
20492号公報に記載のものは、文字の前後の文字列
から同様文字か否かを判断して修正対象を認識して探索
するものである。
【0004】
【発明が解決しようとする課題】しかしながら、上記文
書読取装置では、オペレータが修正した文字と同様の修
正を施す修正対象の文字を探索して自動的に修正するよ
うにするため、その修正対象の文字の認識には、大容量
の認識データを必要とする。認識データには、修正文字
コードや確信度があり、修正時に文字画像と比較する場
合には、画像データやレイアウトデータ等が必要とな
る。
【0005】従って、従来の文書読取装置では、修正処
理に際して大容量な記憶部を必要とする問題があった。
また、オペレータが確認する認識データが多いため、修
正処理の時短に際し限界があった。一方、イメージ情報
として読み取る文書は、例えば、各個人毎に特徴が相違
する手書き文字やフォントの相違する印字文字等のよう
に、それぞれの文書又は頁に従って修正対象の文字等の
特徴が相違するのが一般的である。
【0006】ところが、複数の文書であっても、同一人
が記載した文書や数頁に渡る同一フォント等のように特
徴が統一している場合であっても、一頁毎に同様誤り文
字の修正処理を施すようにするのは、オペレータの処理
を煩雑なものにするだけで実益に乏しい。
【0007】
【課題を解決するための手段】そこで本発明は、オペレ
ータが修正した文字の認識データからその修正に際して
必要なデータを抽出することにより修正データを作成す
る修正データ作成部と、この修正データ作成部で作成し
た修正データを格納する修正メモリと、この修正メモリ
に格納した修正データと認識データとを順次比較するこ
とにより1処理単位に相当する認識データ内を探索し
て、オペレータが修正した文字と同様な誤り文字を探索
する探索部と、この探索部で探索した同様な誤り文字を
オペレータが修正したのと同様の文字に修正する修正部
とを有する文書読取装置とした。
【0008】
【作用】このような構成によると、修正メモリに格納し
ておいた修正データに従って同様誤り修正をオペレータ
の修正作業よりも先に行うことで、オペレータの修正文
字数が減り、オペレータの修正作業が容易になる。
【0009】
【実施例】以下に、図面を参照して、本発明の実施例を
説明する。 実施例1 図1は、文書読取装置の構成を示すブロック図である。
この文書読取装置1は、画像入力部2、画像メモリ3、
文字認識部4、認識メモリ5、修正処理部6を有し、そ
れぞれが総合制御部7と接続されるようにしてある。
【0010】前記画像入力部2は、読取対象の文書を光
学的に走査し、文書上に記録された文字イメージを読み
取り、画像データを作成するものである。なお、画像フ
ァイルや通信回線を介して他システムから画像データを
得ることもできる(図示せず)。前記画像メモリ3は、
画像入力部2が作成した画像データを格納するものであ
る。
【0011】前記文字認識部4は、画像メモリ3内の画
像データから文字領域を抽出し、さらに、文字領域から
行、文字を切り出して1文字毎の文字画像を抽出し、こ
の文字画像を認識して認識データを作成するものであ
る。前記認識メモリ5は、文字認識部4が作成した認識
データを格納するものである。
【0012】前記修正処理部6は、修正データの作成・
追加、同様誤り文字の探索・修正をするものである。こ
の修正処理部6は、オペレータの修正操作に従い認識デ
ータから作成した修正データを修正メモリ8に格納する
修正データ作成部9、修正メモリ8内の修正データに従
い同様誤り文字を探索する探索部10、および、この探
索部10で探索した同様誤り文字を修正メモリ8内の修
正データに従い修正をする修正部11を有するものであ
る。
【0013】前記修正メモリ8は、例えば、図2に示す
ように、修正した文字毎に、認識データから第3位迄の
候補文字と修正文字とを修正データとして格納する。前
記総合制御部7は、上記各部や各メモリの動作全体を制
御するものであり、認識結果を表示部12(CRT等)
に表示したり、オペレータが操作部13(キーボード、
マウス等)を操作して動作制御の指示をすることができ
るようにしてある。
【0014】なお、この文書読取装置1では、修正処理
の処理単位を1頁毎として説明するが、これに限らず、
例えば、認識メモリ5の認識データに応じて1文書毎に
修正処理を施すようにしてもよく、また、認識メモリ5
に格納されている複数文書を1度に処理するようにして
もよい。次に、上記構成の文書読取装置の動作を説明す
る。
【0015】図3は、実施例1の文書読取処理のフロー
チャートである。 Sa1:画像入力部2により画像を1頁毎に入力する。
すなわち、画像入力部2は、読取対象の入力文書を光学
的に走査し、文書上に記録された文字、およびイメージ
を光電変換により画像信号に変換し、さらに、この画像
信号をデジタル二値の画像データに変換する。この画像
データを総合制御部7により表示部12に画像表示し、
オペレータが操作部13を使い、この画像データを確認
する。もし、画像データに不良があれば、再度画像入力
する。確認後の画像データを画像メモリ3に格納し、処
理をSa2に移す。 Sa2:上記Sa1の画像入力が終わると、文字認識部
4により文字認識する。文字認識部4は、画像メモリ3
内の画像データから黒画素の周辺分布ヒストグラムを利
用して領域を抽出し、各領域の幾何学的特徴により領域
を文字とイメージとに判別する。さらに、文字領域の画
像データから周辺分布ヒストグラムを利用して、行を切
り出し、行から文字を切り出す。そして、この切り出し
た1文字毎の文字画像を認識処理により(複数の候補)
文字コードを得る。この文字コードを認識データとして
認識メモリ5に格納する。 Sa3:上記Sa2の文字認識が終わると、オペレータ
が確認・修正を行う。この確認・修正は、オペレータが
操作部13を操作して誤りの文字を修正し、この修正と
同様の誤りを修正処理部6が探索して修正し、処理をS
a4に移す。なお、この処理は後述する。 Sa4:総合制御部7は、確認・修正した認識データを
出力する。総合制御部7は、認識メモリ5に認識データ
を格納し、図示しないプリンタ等から認識結果等を出力
する。また、図示しない出力メモリを介することによ
り、他の文書処理システム(ワープロ、DTPシステ
ム、文書管理システム等)に認識結果を渡したり、通信
により他の文書処理システムに認識結果を渡すようにし
てもよい。 Sa5:オペレータは上記Sa4の結果出力を待って次
のように判断する。今回文書読取処理を施したページが
最終ページであれば、当該処理を終了する。また、最終
ページでなければ、上記Sa1に戻って、次のページの
画像入力を行う。
【0016】次に、上記Sa3の認識データの確認・修
正処理を説明する。図4は、認識データの確認・修正処
理のフローチャートである。 Sb1:修正処理部6は、修正メモリ8に既存の修正デ
ータがある場合には、その修正データにより文字の同様
誤り修正処理を施す。この修正データによる文字の同様
誤り修正処理は、図5を参照して後述するものとする。 Sb2:上記Sb1で修正メモリ8に格納された修正メ
モリに応じて同様誤り修正処理を施し終えたら、オペレ
ータが、表示部12に表示された当該頁の認識データの
確認・修正処理を施す。この確認・修正処理時に、オペ
レータが修正した文字の認識データから修正データを作
成して修正メモリ8に格納し、同頁中の同様誤り修正処
理を自動的に施すようにした。その認識データの確認・
修正処理は、図6を参照して後述するものとするそれで
は、上記Sb1の同様誤り修正処理を説明する。図5
は、既存の修正データによる同様誤り修正処理のフロー
チャートである。 Sc1:修正処理部6は、修正メモリ5内の既存の修正
データの有無をチェックし、修正データが有ればSc2
に進み既存の修正データによる同様誤り修正をする。修
正データが無ければ処理を終了する。このときの修正デ
ータは、例えば、図2に示すように、第3位までの候補
文字の文字コードと修正文字コードで構成するものとす
る。 Sc2:修正処理部6の探索部10は、修正メモリ8の
修正データの着目修正データと、前記認識メモリ5内の
認識データのm番目の文字の認識データとの比較をする
ために、認識データの読み出し文字番号mの初期値を1
にして最初の文字から読み込むようにする。 Sc3:探索部10は、修正データと同様な誤り文字を
探す。すなわち、探索部10は、認識メモリ5内のm番
目の認識データが、修正メモリ8内の着目修正データと
同様な誤り文字か否かを判断する。この判断は、例え
ば、候補文字の第1位から第3位までの文字コードが同
様であるか否かで判断するものとする。同様誤り文字と
判断した場合はSc4に処理を移し、同様誤り文字でな
いと判断した場合はSc5に処理を移す。なお、このと
きの同様誤りの判断は、これに限らず、判断方法に応じ
て必要なデータを適宜設定するようにしてもよい。例え
ば、候補文字とその確信度から判断するようにした特開
平4−199483号公報に記載の技術や、修正対象文
字の前後の文字列から判断するようにした特開平5−2
0492号公報等に記載の公知技術を適用してもよい。
しかし、上記のように、候補文字同士の比較をするだけ
にすると、その比較に要するデータ量が少なくて済むの
で、修正メモリ8の容量に与える影響を少なくすること
ができ、また、その比較に要する時間を短縮することが
期待できる。 Sc4:修正部11は、修正データに従い認識データを
修正する。例えば、修正部11は、認識メモリ5内の第
m番目の認識データを、修正メモリ8内の着目修正デー
タの修正文字コードに修正する。図2中では、第1番目
の修正データの場合には、その第1位〜第3位までの候
補文字と、認識データの候補文字とを比較して同様のと
きに、認識データを修正文字である「問」に置き換える
ようにする。 Sc5:修正処理部6は、認識メモリ5内に格納されて
いる認識データが最終のm番目の文字まで処理したか否
かを確認する。終了していなければ処理をSc6に移
し、終了していれば処理をSc7に移す。 Sc6:修正処理部6は、認識メモリ5からの読みだす
認識データの番号をmから1インクリメントして処理を
上記Sc3に戻す。 Sc7:修正処理部6は、着目修正データを次に移し、
処理を上記Sc1に戻す。
【0017】以上のように、オペレータが認識データを
確認・修正する前に、今までに読み取った同様な文書で
登録した修正データに従い、当該読み取りページの認識
データの同様誤りを修正することにより、オペレータの
確認・修正時間を短縮するこができるようになる。最後
に、上記Sb2の確認・修正処理を説明する。図6は、
当該ページの認識データの確認・修正処理のフローチャ
ートである。なお、同様修正誤り修正は、オペレータの
修正した文字以降の修正を行うものとして説明するが、
オペレータの修正した文字以前の認識データを修正する
ようにしてもよい。 Sd1:総合制御部7は、既存の修正データで修正され
た認識データを認識メモリ5から読み出して表示部12
に表示する。 Sd2:オペレータは、この表示をみて文字の正誤の確
認するために、n=1番目の文字にカーソル等を表示さ
せる。 Sd3:オペレータは、n番目の文字が誤っていると判
断したらSd4の処理を行い、誤っていないと判断した
らSd11の処理を行う。 Sd4:オペレータは、n番目の文字の誤りを修正する
旨を操作部13から入力する。文書読取装置1はその修
正の為の入力が操作部13からあると、総合制御部7を
介して修正処理部6にその旨が伝えられる。すると、修
正処理部6は、表示部12の表示文字に対応する画像メ
モリ3内の画像データを読みだして表示部12にその修
正対象の文字を表示し、認識データとの比較をすること
ができるようにする。オペレータは、表示部12に表示
された画像データと認識データを比較しつつ正しい文字
を修正文字として操作部13から入力する。このとき、
表示文字と画像データの対応を取るため、切り出しデー
タが必要で、例えば、認識メモリ5に認識データと共に
文字切り出し枠データを格納するようにしておくのが好
ましい。また、認識メモリ5から認識データの候補文字
を読みだして、表示部12に画像データと共に表示し、
オペレータにその候補文字から修正文字の選択をさせる
ようにしてもよい。このように選択させると、オペレー
タの修正文字の入力の手間を省くことができる。 Sd5:上記Sd4でオペレータの確認・修正が済んだ
ら、修正データ作成部9は、オペレータが修正した文字
の修正データを認識データから作成し、修正メモリ内に
格納する。例えば、図2に示すように、修正データは修
正した文字の第1位〜第3位までの候補文字コードと修
正した文字コードであり、この修正データを修正メモリ
8に追加する。この追加に続き、上述した同様誤り修正
処理と同様にして、今回格納した修正文字の同様誤り修
正処理を行う。 Sd6:修正処理部6は、まず、mをn+1番目とし
て、認識データ内の探索対象の文字の初期値を上記修正
文字の次から開始するできるようにする。 Sd7:探索部10は、修正データと同様な誤り文字を
探す。すなわち、探索部10は、認識メモリ5内の第m
番目の認識データが、上記Sd5で修正メモリ8に追加
した修正データと同様な誤り文字か否かを判断する。こ
の判断は、例えば、候補文字の第1位から第3位までの
文字コードが同様であるか否かで判断するものとする。
同様誤り文字と判断した場合はSd8に処理を移し、同
様誤り文字でないと判断した場合はSd9に処理を移
す。なお、このときの同様誤りの判断は、上述のように
これに限らない。 Sd8:修正部11は、修正データに従い認識データを
修正する。例えば、修正部11は、認識メモリ5内の第
m番目の認識データを、修正メモリ8内の着目修正デー
タの修正文字コードに修正する。図2中では、第2番目
の修正データの場合には、その第1位〜第3位までの候
補文字と、認識データの候補文字とを比較して同様のと
きに、認識データを修正文字である「文」に置き換える
ようにする。 Sd9:修正処理部6は、認識メモリ5内に格納されて
いる認識データが最終のm番目の文字まで処理したか否
かを確認する。終了していなければ処理をSd10に移
し、終了していれば処理をSd11に移す。 Sd10:修正処理部6は、認識メモリ5からの読みだ
す認識データの番号をmから1インクリメントして処理
を上記Sd7に戻す。 Sd11:修正処理部6は、オペレータが修正した今回
のn番目の修正文字が認識データの最終文字であったか
否かを判断し、最終でなければ処理をSd12に移し総
合制御部7にその旨を伝える。また、1処理単位である
頁の修正処理が最終であれば当該処理を終了する。 Sd12:総合制御部7は、次のn+1番目の文字の確
認・修正を行わせるために、処理を上記Sd3に戻す。
【0018】上記実施例1によると、複数枚の入力文書
を同様誤り修正する場合、修正メモリに当該読み取りペ
ージ以前の修正データの同様誤りを修正することができ
るようになる。また、一般的に、修正データは認識デー
タに比べてデータ量が非常に小さいので、従来の複数枚
の入力文書を認識した認識データを認識メモリに格納す
るのに比べて認識メモリに格納するデータ量が少なくて
済むので、小容量の修正メモリで同様誤り文字の修正を
行うことができ、記憶資源の有効活用が行える。
【0019】実施例2 ここでは、実施例2と実施例1の相違する点を説明す
る。ここで、説明しない部分は、実施例1と同様であ
る。図7は、文書読取装置の構成を示すブロック図であ
る。この文書読取装置1は、上記実施例1と同様に、画
像入力部2、画像メモリ3、文字認識部4、認識メモリ
5、修正処理部6を有し、それぞれが総合制御部7と接
続されるようにしてあるが、修正処理部6内に修正デー
タ名判断部14を設け、修正メモリ8に修正データを修
正データ名毎に格納するようにした点が、上記実施例1
と相違するものであり、他の構成は上記実施例1と同様
である。
【0020】前記修正データ名判断部14は、前記修正
メモリ8に格納する修正データ名の割り振りを行いその
修正データ名毎に修正データを格納するようにし、認識
データに応じて修正データ名を選択するようにしたもの
である。前記修正メモリ8には、例えば、図8に示すよ
うに、(1)の修正データ名のテーブルに対応させて、
(2)や(3)の修正データの格納テーブルを用意する
ようにしてある。図8中では、修正データ名「A新聞」
に対して(2)の修正データの格納テーブルを対応させ
るようにし、修正データ名「B新聞」に対して(3)の
修正データの格納テーブルを対応させるようにしてあ
る。また、修正データ名を人物に対応させて人物毎に修
正データを格納するようにしておくと、その人物の文字
の癖に応じた文字の認識が可能になると期待できる。
【0021】それでは、上記構成の文書読取装置の動作
を説明する。図9は、実施例2の文書読取処理のフロー
チャートである。 Se1:画像入力部2により画像を1頁毎に入力する。
すなわち、画像入力部2は、読取対象の入力文書を光学
的に走査し、文書上に記録された文字、およびイメージ
を光電変換により画像信号に変換し、さらに、この画像
信号をデジタル二値の画像データに変換する。この画像
データを総合制御部7により表示部12に画像表示し、
オペレータが操作部13を操作して画像データに不良が
あれば、再度画像入力させる。不良がなければ画像デー
タを画像メモリ3に格納し、処理をSe2に移す。 Se2:上記Se1の画像入力が終わると、文字認識部
4により文字認識する。文字認識部4は、画像メモリ3
内の画像データから黒画素の周辺分布ヒストグラムを利
用して領域を抽出し、各領域の幾何学的特徴により領域
を文字とイメージとに判別する。さらに、文字領域の画
像データから周辺分布ヒストグラムを利用して、行を切
り出し、行から文字を切り出す。そして、この切り出し
た1文字毎の文字画像を認識処理により(複数の候補)
文字コードを得る。この文字コードを認識データとして
認識メモリ5に格納する。 Se3:上記Se2の文字認識が終わると、オペレータ
が修正データ名を指定する。オペレータは、表示部12
と操作部13とを使用して既存の修正データ名、または
新規の修正データ名を指定する。このときの新規の修正
データ名は、適宜設定可能にすることができるようにし
ておけばよい。すなわち、まず、総合制御部7は、修正
データ名の指定画面を表示部12に表示する。その表示
は、例えば、図10に示すように、修正データ名の指定
エリアa1と、既存の修正データを指定するための修正
データ名リストの表示エリアa2とを主に表示するよう
にする。また、表示エリアa2は、反転するカーソルで
オペレータが操作部13を操作することにより移動する
ことができるようにしておく。このような表示状態で、
オペレータがそのカーソルを移動して修正データ名を選
択すると、総合制御部7は、その選択した修正データ名
のデータを修正処理部6に伝える。修正処理部6では、
修正データ名判断部14が、その伝えられたデータに対
応する修正メモリ8内の修正データ名のテーブルを選択
し、そのテーブルに対応する修正データの格納テーブル
を呼び出す。このとき、総合制御部7は、表示部12の
修正データ名エリアa1にその選択された修正データ名
を表示する。そして、下記Se4で上記実施例1と同様
に、その表示された修正データ名に対応した修正データ
により、文書を1処理単位毎に同様誤り文字修正処理を
施す。なお、新規の修正データ名を登録する場合は、オ
ペレータが修正データ名エリアa1にその修正データ名
を入力することにより、その修正データ名を総合制御部
7を介して修正処理部6の修正データ名判断部14に伝
えられる。そして、この修正データ名判断部14は新規
の修正データ名に対応する修正データ名を登録し、その
修正データ名に対応して新規の修正データの格納テーブ
ルを割り振る。 Se4:上記Se3の修正データ名の指定が終わると、
オペレータが確認・修正を行う。この確認・修正は、オ
ペレータが操作部13を操作して誤りの文字を修正し、
この修正と同様の誤りを修正処理部6が探索して修正し
て、処理をSe5に移す。なお、この処理は上記実施例
1のSa3と同様である。 Se5:総合制御部7は、確認・修正した認識データを
出力する。総合制御部7は、認識メモリ5に認識データ
を格納し、図示しないプリンタ等から認識結果等を出力
する。また、図示しない出力メモリを介することによ
り、他の文書処理システム(ワープロ、DTPシステ
ム、文書管理システム等)に認識結果を渡したり、通信
により他の文書管理システムに認識結果を渡すようにし
てもよい。 Se6:オペレータは上記Se5の結果出力を待って次
のように判断する。今回文書読取処理を施したページが
最終ページであれば、当該処理を終了する。また、最終
ページでなければ、上記Se1に戻って、次のページの
画像入力を行う。
【0022】なお、修正データ名の選択において、読み
取る文書に修正データ名を表す表示を付けておき、その
表示を読み取ることにより、修正データ名を自動的に指
定するようにしてもよい。例えば、その表示をバーコー
ド等によりおこない、図示しないバーコード読取部によ
りそのバーコードを読み込むことにより自動的に修正デ
ータ名を指定するようにしてもよい。
【0023】このようにすると、決められた種類の文書
(修正データ名に応じた種類の文書)の読取処理を行う
場合に、オペレータが文書又は頁毎に修正データ名を入
力しなくてもよくなる。例えば、複数枚の伝票A、複数
枚の伝票B、複数枚の伝票Cの3種類の伝票の読取処理
を行う場合に、予め伝票の種類に応じたバーコードを各
伝票に付与しておけば、それぞれの伝票の画像入力時
に、オペレータが修正データ名をその都度入力しなくて
も、そのバーコードをバーコード読取部が自動的に読み
込んで修正データ名を指定することができる。
【0024】上記実施例2によると、複数の同様誤り傾
向を示す修正データを修正データ名毎に探索することが
できるようになり、同じ特徴を持つ文書を他の特徴を持
つ文書に交えて読み取らせる場合にも、適宜修正データ
名を選択することで同じ特徴の文書の同様誤りを容易に
行うことができるようになる。また、修正データを修正
データ名毎に蓄積していくことで、より精度の高い同様
誤り修正を行うことができるようになると期待できる。
【0025】実施例3 ここでは、実施例3と実施例1の相違する点を説明す
る。ここで、説明しない部分は、実施例1と同様であ
る。図11は、文書読取装置の構成を示すブロック図で
ある。この文書読取装置1は、上記実施例1と同様に、
画像入力部2、画像メモリ3、文字認識部4、認識メモ
リ5、修正処理部6を有し、それぞれが総合制御部7と
接続されるようにしてあるが、修正処理部6内に読取モ
ード/修正データ名判断部15を設け、修正メモリ8に
修正データを修正データ名毎に格納するようにした点
が、上記実施例1と相違するものであり、他の構成は上
記実施例1と同様である。
【0026】前記読取モード名/修正データ名判断部1
5は、修正データ名や他のパラメータを含む上位の読取
モード名に応じて、上記実施例2の修正データ名判断部
14と同様の動作をすると共に、読取モード名に応じた
読取パラメータを図示しないパラメータメモリ等に読み
書きするようにしたものである。ここで、読取パラメー
タには、入力文書サイズ、レイアウト、認識文字の字
体、字種等がある。この読取パラメータは、複数の文書
を読み取る場合には文書又は頁毎にそれそれ異なるた
め、読取モード名に対応させてそれぞれの文書又は頁毎
にパラメータメモリに格納するようにしておき、文書又
は頁毎に読取モード名に応じて読取パラメータを読みだ
して入力文書サイズ等を設定することができるようにし
たものである。
【0027】前記修正メモリ8には、例えば、図12に
示すように、(1)の読取モード名のテーブルに対応さ
せて、(2)や(3)のように読取モード名に対応する
修正データ名の修正データの格納テーブルを用意するよ
うにしてある。図12中では、読取モード名「a新聞」
に対して(2)の修正データの格納テーブルを対応させ
るようにし、読取モード名「b新聞」に対して(3)の
修正データの格納テーブルを対応させるようにしてあ
る。また、読取モード名に対応して上述した読取パラメ
ータを図示しないテーブルに格納しておく。
【0028】なお、読取データ名の選択は、上記実施例
2の修正データ名の選択と同様にして行うことができ
る。上記実施例3によると、同様な文書を連続しないで
他の文書を交えて読み取るような場合に、その都度、オ
ペレータが文書毎の読取パラメータを設定しなくてもよ
くなり、オペレータの処理スピードが速くなることが期
待できる。
【0029】
【発明の効果】以上説明したように本発明の文書読取装
置によると、修正メモリに格納しておいた修正データに
従って同様誤り修正をオペレータの修正作業よりも先に
行うことにより、オペレータの修正文字数が減り、オペ
レータの修正作業が容易になり、修正作業の効率化が図
れる効果が得られる。また、複数枚の入力文書を同様誤
り修正する場合、修正メモリに当該読み取りページ以前
の修正データの同様誤りを修正することができる効果が
得られる。さらに、従来の複数枚の入力文書を認識した
認識データを認識メモリに格納するのに比べ格納するデ
ータ量が少ない修正データを修正メモリに格納しておく
ようにしたので、記憶資源の有効活用が行えるという効
果が得られる。
【図面の簡単な説明】
【図1】実施例1の文書読取装置の構成を示すブロック
【図2】実施例1の修正データの例示図
【図3】実施例1の文書読取処理のフローチャート
【図4】実施例1の認識データの確認・修正処理のフロ
ーチャート
【図5】既存の修正データによる同様誤り修正処理のフ
ローチャート
【図6】当該ページの認識データの確認・修正処理のフ
ローチャート
【図7】実施例2の文書読取装置の構成を示すブロック
【図8】実施例2の修正データの例示図
【図9】実施例2の文書読取処理のフローチャート
【図10】修正データ名の指定画面の例示図
【図11】実施例3の文書読取装置の構成を示すブロッ
ク図
【図12】実施例3の修正データの例示図
【符号の説明】
1 文書読取装置 2 画像入力部 3 画像メモリ 4 文字認識部 5 認識メモリ 6 修正処理部 7 総合制御部 8 修正メモリ 9 修正データ作成部 10 探索部 11 修正部 12 表示部 13 操作部 14 修正データ名判断部 15 読取モード名/修正データ名判断部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 媒体に記載された文字や図形等のイメー
    ジ情報を走査して画像データを作成する画像入力部と、
    この画像入力部で作成された画像データを格納する画像
    メモリと、この画像メモリ内の画像データから文字を切
    り出し、切り出した文字画像を認識して認識データを作
    成する文字認識部と、この文字認識部が作成した認識デ
    ータを格納する認識メモリとを有し、認識メモリに格納
    した認識データを表示部に表示してオペレータにその認
    識データの確認をさせ、正しい文字認識が行われなかっ
    た文字をオペレータの操作部の操作により修正させるよ
    うにした文書読取装置において、 オペレータが修正した文字の認識データからその修正に
    際して必要なデータを抽出することにより修正データを
    作成する修正データ作成部と、 この修正データ作成部で作成した修正データを格納する
    修正メモリと、 この修正メモリに格納した修正データと認識データとを
    順次比較することにより1処理単位に相当する認識デー
    タ内を探索して、オペレータが修正した文字と同様な誤
    り文字を探索する探索部と、 この探索部で探索した同様な誤り文字をオペレータが修
    正したのと同様の文字に修正する修正部とを有すること
    を特徴とする文書読取装置。
  2. 【請求項2】 請求項1において、複数の文書別に修正
    データ名を付け、その修正データ名毎に修正データを修
    正メモリに格納しておき、探索部が探索対象の認識デー
    タに応じて修正データ名を選択し、その修正データ名に
    対応する修正データで1処理単位に相当する認識データ
    内を探索するようにし、第2修正手段がその修正データ
    名に対応する修正データで同様誤り文字を修正するよう
    にしたことを特徴とする文書読取装置。
  3. 【請求項3】 請求項1において、1処理単位は、媒体
    の一頁毎であることを特徴とする文書読取装置。
JP7135419A 1995-06-01 1995-06-01 文書読取装置 Pending JPH08329186A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7135419A JPH08329186A (ja) 1995-06-01 1995-06-01 文書読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7135419A JPH08329186A (ja) 1995-06-01 1995-06-01 文書読取装置

Publications (1)

Publication Number Publication Date
JPH08329186A true JPH08329186A (ja) 1996-12-13

Family

ID=15151300

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7135419A Pending JPH08329186A (ja) 1995-06-01 1995-06-01 文書読取装置

Country Status (1)

Country Link
JP (1) JPH08329186A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002207960A (ja) * 2001-01-12 2002-07-26 Nippon Digital Kenkyusho:Kk 認識文字修正方法及び認識文字修正プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002207960A (ja) * 2001-01-12 2002-07-26 Nippon Digital Kenkyusho:Kk 認識文字修正方法及び認識文字修正プログラム

Similar Documents

Publication Publication Date Title
CA2077274C (en) Method and apparatus for summarizing a document without document image decoding
US6466694B2 (en) Document image processing device and method thereof
US7081975B2 (en) Information input device
JP4118349B2 (ja) 文書選択等の方法及び文書サーバ
JPH0793374A (ja) 文書検索方法及びシステム
JPH0797373B2 (ja) 文書フアイリングシステム
JPH0668298A (ja) 文書書式の文字認識及びデータ修復処理のためのデータ処理システム及び方法
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JPH08329186A (ja) 文書読取装置
JP4823049B2 (ja) 文書画像検索装置及びプログラム
JP4677750B2 (ja) 文書属性取得方法および装置並びにプログラムを記録した記録媒体
JPH08153110A (ja) 文書ファイリング装置及び方法
JP3725953B2 (ja) 文字認識装置
JP3424942B2 (ja) 対訳画像形成装置
JPH04104367A (ja) ファイルシステム
JPH04348475A (ja) 画像情報検索方法及びその装置
JPH113401A (ja) 情報処理装置及びその方法
JPH0757040A (ja) Ocr付きファイリング装置
JPH09204511A (ja) ファイリング装置
JP2829186B2 (ja) 光学的文字読取装置
JPH08202859A (ja) 電子ファイリング装置及びその方法
JPH04302070A (ja) 文字認識装置及び方法
JPH0492973A (ja) イメージ情報登録検索装置
JP2874815B2 (ja) 日本語文字読取装置
JPH06259594A (ja) 光学的読取りデータの処理方法及び同装置