JPH0916712A - 文書読取装置 - Google Patents

文書読取装置

Info

Publication number
JPH0916712A
JPH0916712A JP7160315A JP16031595A JPH0916712A JP H0916712 A JPH0916712 A JP H0916712A JP 7160315 A JP7160315 A JP 7160315A JP 16031595 A JP16031595 A JP 16031595A JP H0916712 A JPH0916712 A JP H0916712A
Authority
JP
Japan
Prior art keywords
data
correction
character
layout
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7160315A
Other languages
English (en)
Inventor
Tetsuo Nakamura
哲夫 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP7160315A priority Critical patent/JPH0916712A/ja
Publication of JPH0916712A publication Critical patent/JPH0916712A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 文書を読み取る際、削除や挿入等の修正部分
を含んだ状態で読み取りを行い、かつ修正部分を誤認識
しないで文字認識できるようにする。 【構成】 制御部12は、操作部11を使いオペレータ
により画像データの修正部分および修正内容が指定され
ると、修正制御手段12aにてこの修正指定をレイアウ
トメモリ4に格納する。レイアウト解析部3は、この修
正指定を受けて修正解析手段3aにて修正データを組み
込んだレイアウトデータを作成してレイアウトメモリ4
に格納する。そして、文字認識部5は、文字認識する際
に、修正認識手段5aにて前記修正データに従い修正処
理しながら認識データを作成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文書上に記録された文
字と文字以外の図形、絵、写真および罫線等のイメージ
を読み取る文書読取装置に関する。特に、手書き修正を
加えた活字印刷文書の認識方法に関する。
【0002】
【従来の技術】文書読取装置は、読み取り対象の文書か
らスキャナ等を用いて画像データを作成し、画像データ
から文字とイメージの領域を識別し、文字領域から行さ
らには文字を切り出すレイアウト解析を行ってレイアウ
トデータを作成し、画像データとレイアウトデータから
1文字毎の画像データを認識して文字コードに変換し、
画像データ、レイアウトデータ、文字コードを用いて文
書データを作成するものである。
【0003】従来、この種の文書読取装置では、添削等
により手書き修正を加えた活字印刷文書の認識で、手書
き修正部分を活字印刷部分と同様に処理していた。
【0004】
【発明が解決しようとする課題】従来の文書読取装置で
は、手書き修正部分を活字印刷部分と同様に認識するの
で、以下に示す問題点がある。図11は従来の文書読取
装置の問題点の説明図である。 (1) 削除により修正した場合。
【0005】取消線を記入した文字を文字切り出しを間
違えて認識するため、不要な文字が認識結果に入ってし
まう。また、平均文字幅を使って文字切り出しする場
合、取消線を記入した文字が原因で1行全部の文字切り
出しを誤る可能性がある。 (2) 置換により修正した場合。 置換する手書き文字の行と、置換される取消線を記入し
た文字を含む活字行を、2行に分離できる場合と、分離
できず1行になる場合がある。2行:手書き行を活字と
して認識して不要な行が認識結果に入る。そして、この
ときは認識不良の場合が多い。また、置換される取消線
を記入した文字を含む活字行は、取消線を記入した文字
を認識するため、不要な文字が認識結果に入る。さら
に、平均文字幅を使って文字切り出しする場合、取消線
を記入した文字が原因で1行全部の文字切り出しを誤る
可能性がある。 1行:手書き修正部分の認識が不良となり間違った認識
結果となる。このとき、手書き修正部分の前後も間違っ
た認識結果となってしまうことがある。また、行高さを
使って文字切り出しする場合、行が高くなるので当該行
の文字切り出しを間違えてこの行全部が認識不良とな
る。 (3) 挿入により修正した場合。
【0006】挿入する手書き文字の行と、挿入記号と、
挿入される活字行の行切り出しは、3行、手書き行+挿
入記号と活字行の2行、手書き行と挿入記号+活字行の
2行、1行に切り出す場合がある。 3行:手書き行を活字として認識して不要な行が認識結
果に入る。挿入記号を文字行として認識して不要な行が
認識結果に入る。活字行は挿入文字を含まない認識結果
となる。 2行(手書き行+挿入記号と活字行):手書き行+挿入
記号を活字として認識して不要な行が認識結果に入る。
活字行は挿入文字を含まない認識結果となる。 2行(手書き行と挿入記号+活字行):手書き行を活字
として認識して不要な行が認識結果に入る。活字行は挿
入記号の活字部分を認識するため不要な文字が入り、ま
た、挿入文字を含まない認識結果となる。 1行:手書き行と挿入記号と活字部分を一緒に認識する
ため不要な文字が入り、また、挿入文字を含まない認識
結果となる。
【0007】以上のように、従来の文書読取装置では、
手書きによる修正があると、認識誤りが多くなるので、
オペレータによる手書き修正に従った認識結果の修正作
業量が多大になってしまうものであった。
【0008】
【課題を解決するための手段】上述した課題を解決する
ため、本発明は、画像データからレイアウトデータを作
成し格納するレイアウト解析手段に、オペレータにより
指示された修正部分およびその修正内容に応じた修正デ
ータを組み込んだレイアウトデータを作成する手段を備
える。そして、文字認識手段は、前記レイアウト解析手
段にて作成された修正データが組み込まれたレイアウト
データに応じて画像データから認識データを作成する手
段を備える。
【0009】
【作用】上述した構成を有する本発明は、読み取り対象
となる文書を走査して画像データを得て、オペレータに
よりこの画像データの画像表示に対して修正部分および
修正内容が指定されると、レイアウト解析時に修正部分
およびその修正内容を組み込んだレイアウトデータを作
成し、文字認識する際に、この修正データが組み込まれ
たレイアウトデータに従い修正部分は修正しながら認識
データを作成し、これを出力することとする。
【0010】
【実施例】図1は本発明の第1の実施例の文書読取装置
の構成を示すブロック図である。画像入力部1は、読み
取り対象の文書を光学的に走査し、画像データを作成す
る。また、画像ファイルや通信回線を介して図示しない
他システムから画像データを得ることもできる。
【0011】画像メモリ2は、画像入力部1から出力さ
れる画像データを格納する。レイアウト解析部3は、画
像メモリ2内の画像データから領域を抽出し、それぞれ
の領域を文字とイメージに識別し、さらに、文字領域か
ら行を切り出し、行から文字を切り出す。上述した領
域、行、文字の処理結果でレイアウトデータを構成す
る。
【0012】レイアウトメモリ4は、レイアウト解析部
3から出力されるレイアウトデータを格納する。文字認
識部5は、レイアウトメモリ4内のレイアウトデータ
と、画像メモリ2内の画像データとから、1文字毎の画
像データを認識して文字コードに変換する。この文字コ
ードを認識データとする。さらに、文字認識部5は、こ
の認識データを知識処理することもできる。
【0013】認識メモリ6は、文字認識部5から出力さ
れる認識データを格納する。結果出力部7は、画像メモ
リ2内の画像データと、レイアウトメモリ4内のレイア
ウトデータと、認識メモリ6内の認識データの少なくと
も1つを使って文書データを作成し、この文書データを
プリンタ8や出力メモリ9等の出力装置に出力する。そ
して、出力メモリ9を介して、他の文書データ処理シス
テム(ワープロ、DTPシステム、文書管理システム
等)に文書データを渡す。または、通信により他の文書
データ処理システムに文書データを渡すこともできる。
【0014】CRT等の表示部10とキーボードやマウ
ス等の操作部11は、処理の開始・終了指示、処理結果
(画像データ、レイアウトデータ、および認識データ)
の表示およびその確認・修正等、オペレータと文書読取
装置とのインタフェースをとる。制御部12は、上述し
た各部、各メモリの動作全体を制御する。
【0015】ここで、この制御部12には、後述する修
正内容および修正箇所を指定してなる修正データに応じ
て各部を制御する修正制御手段12aが備えられる。ま
た、前記レイアウト解析部3には、前記修正データに応
じて行切り出しを行い、修正データを含む行データを作
成してレイアウトメモリ4に格納するとともに、修正デ
ータを含む行データから文字切り出しを行い、修正デー
タを含む文字データを作成してレイアウトメモリ4に格
納する修正解析手段3aが備えられ、そして前記文字認
識部5には、前記レイアウト解析部3で作成された修正
データを含む文字データに対して文字認識を行う修正認
識手段5aが備えられている。
【0016】図2は上述した第1の実施例の文書読取装
置の動作を示す処理フローチャートであり、以下、第1
の実施例の文書読取装置の動作を説明する。なお、図中
のSは処理ステップを表している。まず、画像入力部1
により画像入力する(S1)。この画像入力は、画像入
力部1により、読み取り対象の入力文書を光学的に走査
し、文書上に記録された文字およびイメージを光電変換
により画像信号に変換し、さらにこの画像データをデジ
タル2値の画像データに変換する。この画像データを画
像メモリ2に格納する。
【0017】画像入力が終わると、レイアウト解析部3
により領域解析する(S2)。領域解析は、まず、レイ
アウト解析部3により、画像メモリ2内の画像データか
ら黒画素の周辺分布ヒストグラムを利用する方法等を使
って領域を抽出し、各領域の幾何学的特徴により領域を
文字とイメージに識別する。領域解析が終わると、オペ
レータにより領域データを確認・修正する(S3)。領
域データの確認・修正処理は、制御部12により前記領
域データ(枠表示)と画像メモリ2内の画像データを表
示部10に重ねて表示し、オペレータにより操作部11
を使い領域データを確認・修正する。確認・修正後の領
域データをレイアウトメモリ4に格納する。
【0018】領域データの確認・修正が終わると、レイ
アウト解析部3により行切り出しする(S4)。この行
切り出しは、レイアウト解析部3により、レイアウトメ
モリ4内の領域データに従い、画像メモリ2内の文字領
域の画像データから黒画素の周辺分布ヒストグラムを利
用する方法等を使って行を切り出す。行切り出しが終わ
ると、オペレータにより行データを確認・修正する(S
5)。この行データの確認・修正処理は、制御部12に
より前記行データ(枠表示)と画像メモリ2内の画像デ
ータを表示部10に重ねて表示し、オペレータにより操
作部11を使い行データを確認・修正する。確認・修正
後の行データをレイアウトメモリ4に格納する。
【0019】行データの確認・修正が終わると、レイア
ウト解析部3により文字切り出しする(S6)。この文
字切り出し処理は、レイアウト解析部3により、レイア
ウトメモリ4内の行データに従い、画像メモリ2内の行
の画像データから黒画素の周辺分布ヒストグラムを利用
する方法等を使って文字を切り出す。文字切り出しが終
わると、オペレータにより文字データを確認・修正する
(S7)。この文字データの確認・修正処理は、制御部
12により前記文字データ(枠表示)と画像メモリ2内
の画像データを表示部10に重ねて表示し、オペレータ
により操作部11を使い文字データを確認・修正する。
確認・修正後の文字データをレイアウトメモリ4に格納
する。
【0020】文字データの確認・修正が終わると、文字
認識部5により文字認識する(S8)。この文字認識処
理は、文字認識部5により、レイアウトメモリ4内のレ
イアウトデータに従い、画像メモリ2内の画像データの
文字画像を、文字認識部5内にある標準的な文字の認識
特徴を格納した認識辞書を用いたパターンマッチングに
より文字コード(候補文字を含む)に変換する。さら
に、この文字コードを文字認識部5内にある単語辞書、
文法ルールを使って、知識処理して修正する。この文字
コードを認識データとする。そして、この認識データを
認識メモリ5に格納する。
【0021】文字認識が終わると、オペレータが認識デ
ータを確認・修正する(S9)。認識データの確認・修
正処理は、制御部12により表示部10に認識メモリ6
内の認識データを文字(テキスト)表示し、レイアウト
メモリ4内のレイアウトデータに従い画像メモリ2内の
画像データを画像表示し、オペレータが操作部11を使
ってこの文字表示と画像表示を比較して認識データを確
認・修正する。確認・修正後の認識データを認識メモリ
6に格納する。
【0022】認識データの確認・修正が終わると、結果
出力部7により読み取り結果を出力する(S10)。こ
の結果出力処理は、結果出力部7により、画像メモリ2
内の画像データと、レイアウトメモリ4内のレイアウト
データと、認識メモリ6内の認識データの中の少なくと
も1つから文書データを作成し、この文書データをプリ
ンタ8で印刷、または出力メモリ9に格納する。
【0023】次に、手書き修正部分がある場合の処理を
説明する。読み取り対象の文書に手書き修正部分がある
場合、図2のS3の領域データの確認・修正処理時に、
手書き修正部分をオペレータが指定する。図3は第1の
実施例における手書き修正部分の指定方法を示す説明
図、図4は手書き修正部分の指定前に使う第1の実施例
の手書き修正部分の種類の選択メニューを示す説明図で
ある。
【0024】図2S3の領域データの確認・修正処理で
は、表示部10に画像メモリ2内の画像データに重ねて
領域データを表示する。このとき、文字領域枠とイメー
ジ領域枠は線色、線種等で区別する。オペレータが、こ
の文字領域の表示を見て手書き修正部分を発見し、この
手書き修正部分が図3(a)欄に示す削除の場合、図4
に示すように表示部10に表示している選択メニューの
中の「削除」を操作部11のマウスで選択することで修
正内容を指定し、操作部11のマウスのドラグにより、
図3(c)欄に示すように修正の種類に対応させて決め
てある削除枠110により修正部分を指定する。
【0025】同様に、手書き修正部分が図3(a)欄に
示す置換の場合、選択メニューの「置換」を選択して修
正内容を指定し、マウスドラグにより追加枠120の指
定後に削除枠110により修正部分を指定する。このと
き、制御部12の修正制御手段12aにより追加枠12
0と削除枠110を連結線130で自動的に結ぶ。同様
に、手書き修正部分が図3(a)欄に示す挿入の場合、
選択メニューの「挿入」を選択して修正内容を指定し、
マウスドラグにより追加枠120の指定後に挿入記号1
40、挿入線150により修正部分を指定する。このと
き、制御部12の修正制御手段12aにより追加枠12
0と挿入記号140を連結線130で自動的に結ぶ。
【0026】そして、手書き修正部分の指定と領域デー
タの確認・修正の終了時、制御部12は、修正制御手段
12aにてこの修正内容および修正箇所からなる手書き
修正データを領域データに追加してレイアウトメモリ4
に格納する。図2S4のレイアウト解析部3による行切
り出しにおいて、レイアウトメモリ4内の文字領域デー
タに手書き修正データがある場合は、レイアウト解析部
3は修正解析手段3aによりこの手書き修正データの削
除枠110、追加枠120、挿入記号140に対応する
画像メモリ2内の画像データを除いた文字領域の画像デ
ータに対して行を切り出して行データを作成する。この
削除枠110、追加枠120、挿入記号140に対応す
る画像メモリ2内の画像データの除去は、例えば、読み
出した画像データの黒画素を白画素とすることにより行
う。
【0027】この行データに前記領域データに追加した
手書き修正データを移動して、この手書き修正データを
含んだ行データをレイアウトメモリ4に格納する。図2
S5のオペレータによる行データの確認・修正処理にお
いて、レイアウトメモリ4内の行データに手書き修正デ
ータがある場合は、制御部12は修正制御手段12aに
より表示部10に画像メモリ2内の画像データに重ねて
行データを表示し、さらに、手書き修正データを図3の
(b)欄に示すように表示する。なお、この行データの
確認・修正処理時におけるオペレータによる修正は、手
書き修正データにも適用できる。確認・修正後の手書き
修正データを含んだ行データをレイアウトメモリ4に格
納する。
【0028】図2S6のレイアウト解析部3による文字
切り出しにおいて、レイアウトメモリ4内の行データに
手書き修正部分がある場合は、レイアウト解析部3は修
正解析手段3aによりこの手書き修正データの削除枠1
10、追加枠120、挿入記号14の部分に対応する画
像メモリ2内の画像データを除いた行の画像データに対
して文字を切り出して文字データを作成する。また、追
加枠120に対応する画像メモリ2内の画像データに対
して、例えば手書き文字対応のフリーピッチの文字を切
り出して手書き修正文字データを作成する。以上の手書
き修正文字データを含んだ文字データをレイアウトメモ
リ4に格納する。
【0029】図2S7のオペレータによる文字データの
確認・修正処理において、レイアウトメモリ4内の文字
データに手書き修正データがある場合、制御部12は修
正制御手段12aにより表示部10に画像メモリ2内の
画像データに重ねて文字データを表示し、さらに、手書
き修正文字データを文字データと同様に表示する。な
お、この文字データの確認・修正処理時におけるオペレ
ータによる修正は、手書き修正文字データにも適用でき
る。確認・修正後の手書き修正文字データを含んだ文字
データをレイアウトメモリ4に格納する。
【0030】図2S8の文字認識処理において、レイア
ウトメモリ4内にレイアウトデータに手書き修正(文
字)データがある場合の処理を図5を用いて説明する。
ここで、図5は第1の実施例の手書き修正部分の文字認
識方法の説明図である。手書き修正データが削除の場
合、文字認識部5は修正認識手段5aにより削除枠11
0部分を除いた画像メモリ2内の画像データについて、
文字データに従い、活字文字認識(標準的な活字の認識
特徴を格納した認識辞書を使った文字認識)する。手書
き修正データが置換の場合、修正認識手段5aにより削
除枠110部分を除いた画像メモリ2内の画像データに
ついて、追加枠120部分を手書き修正文字データに従
い、手書き文字認識(標準的な手書き文字の認識特徴を
格納した認識辞書を使った文字認識)し、この追加枠に
連結した削除枠110を含んだ行を文字データに従い活
字文字認識し、この活字文字認識結果の削除枠位置に前
記手書き文字認識結果を追加する。手書き修正データが
挿入の場合、修正認識手段5aにより挿入記号140部
分を除いた画像メモリ2内の画像データについて、追加
枠120部分を手書き修正文字データに従い手書き文字
認識し、この追加枠に連結した挿入記号と挿入線を含ん
だ行を文字データに従い活字文字認識し、この活字文字
認識結果の挿入線位置に前記手書き文字認識結果を追加
する。以上の文字認識結果(認識データ)を認識メモリ
6に格納する。以上の処理により、手書き修正があって
も、その部分を正しく認識することができるものであ
る。
【0031】以上説明した第1の実施例によれば、以下
のような効果が得られる。すなわち、第1の実施例によ
れば、領域データの確認・修正処理の段階でオペレータ
により手書き修正部分を指定し、この手書き修正部分を
以降のレイアウト解析、文字認識で手書き修正指定に従
って処理するので、手書き修正が行われた状態で認識結
果を作成でき、また、手書き修正による活字部分への悪
影響、例えば、行、文字切り出し不良、手書き修正部分
が活字部分に入り込むことによる文字認識不良等を防止
できる。このため、手書き修正を含んだ認識率の高い認
識結果を得られ、また、認識結果の修正操作が削減でき
処理時間を短縮できる。
【0032】次に本発明の第2の実施例を説明する。な
お、第2の実施例において文書読取装置の制御ブロック
は図1で説明した第1の実施例のものと同じである。ま
た、画像入力から結果出力までの処理の流れは、図2の
フローチャートで説明した処理と同じである。第2の実
施例において、レイアウト解析部3の修正解析手段3a
に、手書き修正部分を自動的に検出する機能を付加す
る。図6、図7、図8は手書き修正部分の検出処理フロ
ーチャートで、図6は手書き修正が削除の場合、図7は
手書き修正が置換の場合、図8は手書き修正が挿入の場
合を示している。また、図9は手書き修正部分の検出処
理例の説明図で、図9(a)は削除部分の検出例、図9
(b)は置換部分の検出例、図9(c)は挿入部分の検
出例である。
【0033】まず、図6と図9(a)を用いて削除部分
の検出処理を説明する。この削除部分の検出処理は、図
2のS6で説明した文字切り出し処理時に実行されるも
のである。すなわち、レイアウト解析部3により図2S
2、3の領域解析および領域データの確認・修正、S
4、5の行切り出しおよび行データの確認・修正を行っ
た後、まず、修正解析手段3aは文字を切り出して文字
データを作成する(S11)。この文字データに対して
文字幅CWが当該行の高さLHの2倍(好適任意な値)
よりも大きければS13に進み、文字幅CWが当該行の
高さLHの2倍以下ならばS15に進む(S12)。S
13は、取消線を検出するために行方向のランレングス
を調べる。このとき、取消線の傾き、曲げを考慮して幅
を持たせてランレングスを調べる。ランレングスを調べ
て、最長、あるいは取消線を2本として、2番目に長い
もののランレングスRLHがS12の文字幅CWの0.
8倍(好適任意な値)よりも長ければ、S14へ進み、
短ければS15に進む。調べた文字データが上記S12
とS13の条件を満たしていれば、S14の処理として
当該文字を削除部分とする。すなわち、図9(a)に示
すように当該文字枠500を削除枠として、この削除枠
を削除部分の手書き修正のデータとする。なお、上記S
12の条件では、文字1字のみを削除している場合には
CW<LH×2となって削除部分を認識できない場合が
あるが、図2S9の認識データの確認・修正処理で1文
字分の削除で済むので、操作量が少なく、削除部分とし
て検出できないことの悪影響は少ないものである。
【0034】そして、最終文字まできたか判断し(S1
5)、最終文字で無ければ次の文字に移り(S16)、
上述したS12からの処理を行い、次の文字データに対
して削除部分であるか否かの判断を行う。各文字データ
に対して削除部分であるか否かの判断を行って、上記S
15で最終文字であると判断すると、処理を終了し、図
2のS7の文字データの確認・修正の処理へ移行する。
【0035】次に、図7と図9(b)を用いて置換部分
の検出処理を説明する。この置換部分の検出処理は、図
2のS4の行切り出し処理時に実行されるものである。
すなわち、 レイアウト解析部3により図2S2、3の
領域解析および領域データの確認・修正を行った後、修
正解析手段3aは領域データの文字領域501と同じ大
きさの黒画像502を作り(S21)、画像メモリ2内
の画像データを縦、横方向に走査して一定値TH(好適
任意の値、例えば10ポイント)より長い白ランがあれ
ば、前記黒画像502を白にして行ブロック画像503
を作成する(S22)。この行ブロック画像503か
ら、行ブロック画像の外形、行ピッチを利用して手書き
行504と活字行505が接触した凸行506、また
は、分離した分離凸行(図示せず)を抽出する(S2
3)。この凸行506の手書き行504と活字行505
の接触する部分に対応する画像メモリ2内の画像データ
の白画素の追跡により手書き行504と活字行505を
分離して分割凸部を作成し、さらに、手書き行の行枠5
07を検出する(S24)。
【0036】次に、この分割凸行の活字行505におい
て手書き行504の近くに削除部分があるかを、図6で
説明した前記削除部分の検出処理と同様にして調べ、削
除部分がある場合はS26へ進み、削除部分がない場合
はS27に進む(S25)。S26は、前記S25で検
出した手書き行と削除部分を合わせて置換部分とする。
すなわち、手書き行枠507を追加枠とし、削除枠50
8、これらを結ぶ連結線509を置換部分の手書き修正
データとする。
【0037】そして、最終文字領域まできたか判断し
(S27)、最終文字領域で無ければ次の文字領域に移
り(S28)、上述したS21からの処理を行い、次の
文字領域データに対して置換部分があるか否かの判断を
行う。各文字領域データに対して置換部分があるか否か
の判断を行って、上記S27で最終文字領域であると判
断すると、処理を終了し、図2のS6の文字切り出し処
理へ移行する。そして、このS6の処理で上述した図6
で説明した削除部分の検出処理を行うことで、置換部分
と削除部分を求めることができることになる。
【0038】次に、図8と図9(c)を用いて挿入部分
の検出処理を説明する。この挿入部分の検出処理も、図
7で説明した置換部分の検出処理と同様に、図2のS4
の行切り出し処理時に実行されるものであり、挿入部分
の検出処理は、図7のS21からS23までの処理の後
に行われる。すなわち、図7のS23にて行ブロック画
像から手書き行と活字行が接触した凸行、または、分離
した分離凸行を抽出した後、修正解析手段3aはこの凸
行または分割凸行の手書き行と活字行の接触部分510
に対応する画像メモリ2内の画像データについて、輪郭
追跡によりその外形特徴、手書き行との幅の比較により
挿入記号511を検出する(S31)。このとき、挿入
記号を囲む挿入記号枠512を作成し、さらに、輪郭追
跡の方向転換により尖端部513を検出する。挿入記号
を検出した場合はS33に進み、挿入記号を検出できな
かった場合はS36に進む(S32)。S33は、S3
1で検出した尖端部513に従い挿入記号枠512に挿
入線514を付加する。そして、前記凸行から挿入記号
により手書き行を分離し、手書き行枠515を作成する
(S34)。この手書き行と挿入記号を合わせて挿入部
分とする(S35)。すなわち、手書き行枠515と、
挿入線514を含む挿入記号枠512と、手書き行枠5
15と挿入記号枠512を結ぶ連結線516を合わせて
挿入部分の手書き修正データとする。なお、手書き行と
活字行の文字切り出し、文字認識では、挿入記号の悪影
響を避けるため、画像データから挿入記号部分を削除し
てから処理する。
【0039】そして、最終文字領域まできたか判断し
(S36)、最終文字領域で無ければ次の文字領域に移
り(S37)、図7で説明したS21からの処理を行
い、次の文字領域データに対して挿入部分があるか否か
の判断を行う。各文字領域データに対して挿入部分があ
るか否かの判断を行って、上記S36で最終文字領域で
あると判断すると、処理を終了し、図2のS6の文字切
り出し処理へ移行する。そして、このS6の処理で上述
した図6で説明した削除部分の検出処理を行うことで、
挿入部分と置換部分と削除部分を求めることができるこ
とになる。
【0040】なお、第2の実施例でも、第1の実施例と
同様に、上述した手書き修正部分の検出結果の確認・修
正は可能である。以上説明した第2の実施例によれば、
レイアウト解析部3により手書き修正部分を自動的に検
出できるので、オペレータが手書き修正部を指定する必
要がなく、オペレータの操作量を削減できる。また、レ
イアウト解析部3を用いた手書き修正部分の自動検出
は、オペレータの指定に比べて処理が早いので、処理時
間を短縮できる。
【0041】次に本発明の第3の実施例を説明する。な
お、第3の実施例において文書読取装置の制御ブロック
は図1で説明した第1の実施例のものと同じである。ま
た、画像入力から結果出力までの処理の流れは、図2の
フローチャートで説明した処理と同じである。第1およ
び第2の実施例では、図2のS8の文字認識で手書き修
正に従って処理し、S9の認識データの確認・修正で手
書き修正に従って文字認識した結果を処理した。つま
り、S9の認識データの確認・修正では、認識データに
区別が無く、手書き修正部分と他の部分を同じに扱う。
【0042】これに対して第3の実施例では、上記S8
の文字認識で手書き修正部分を他の処理結果と区別して
認識データを作成し、S9の認識データの確認・修正で
手書き修正部分を他の認識データと区別して処理する。
図10は第3の実施例の認識結果の表示例を示す説明図
である。この図10における認識結果の表示は、表示部
10に表示する認識データの文字表示であり、制御部1
2は手書き修正部分のある画像表示と修正した認識結果
の表示を比較できるように表示する。
【0043】すなわち、認識結果の表示において、手書
き修正データの文字表示部分は、反転表示、表示色、背
景色、網掛け、ブリンク等により、他の認識データの文
字表示と異なる表示とする。そして、手書き修正データ
が削除の場合、削除記号601を表示する。また、手書
き修正データが置換の場合、置換記号602で手書き行
の認識結果を挟んで表示する。さらに、手書き修正デー
タが挿入の場合、挿入記号603で手書き行の認識結果
を挟んで表示する。
【0044】以上の手書き修正データの文字表示を操作
部11を使い、例えばマウスカーソルで指定すると、レ
イアウトメモリ4内のレイアウトデータに従い、画像メ
モリ2内の画像データの手書き修正部分を画像表示し
て、手書き修正部分のある画像表示と修正した認識結果
の表示を比較できるようにする。また、図2S8の認識
データの確認・修正処理では、例えば、以下の機能を追
加する。 (1) 操作部11のキーボードの「タブ」キーの押下
で、次の手書き修正データ部分に修正対象を移動する。 (2) 手書き修正データ部分を修正対象としたとき、
操作部11のマウスやキーボードを使って簡単な操作で
削除記号や置換記号や挿入記号の配置や文字の訂正など
自動修正する。 (3) 複数ある手書き修正データ部分で、同じ修正内
容のものを一括修正する。 (4) 修正済部分を他と同じ表示とする。
【0045】以上のように、第3の実施例によれば、オ
ペレータが表示部10に表示した認識データの文字表示
と画像データの画像表示を比較して、手書き修正部分の
認識データを確認・修正できるので、オペレータによる
手書き修正部分の指定あるいはレイアウト解析部3の修
正解析手段3aによる手書き修正部分の自動検出の誤り
を修正できるので、正しい認識結果が得られる。
【0046】なお、上記第1、第2、第3の実施例で
は、修正部分が手書きのものとしたが、この部分を活字
としても、第1、第2、第3の実施例と同様な処理で正
しく認識処理ができる。また、上記第1、第2、第3の
実施例では、修正部分以外を活字としたが、この部分を
手書きとしても、第1、第2、第3の実施例と同様な処
理で正しく認識処理ができる。
【0047】さらに、第2の実施例の手書き修正部分の
検出で、横書き文書に対する処理を説明したが、縦書き
文書に対しても、走査方向を横から縦にする、文字幅を
縦方向とする等により、同様な処理で修正部分の検出が
行える。同様に、第1、第3の実施例でも、縦書き文書
を処理できる。また、上記第1、第2、第3の実施例で
は、修正部分を削除、置換および挿入としたが、他に順
序入替え、改行、字下げ等の一般の添削部分の読み取り
に適用することも可能である。
【0048】
【発明の効果】以上説明したように、本発明は、オペレ
ータにより修正部分および修正内容が指定されたり、自
動的に修正部分および修正内容が検出されると、この修
正データに従い認識データを作成することとしたので、
手書き修正が行われた状態で認識結果を作成でき、ま
た、手書き修正による活字部分への悪影響、例えば、
行、文字切り出し不良、手書き修正部分が活字部分に入
り込むことによる文字認識不良等を防止できる。このた
め、手書き修正を含んだ認識率の高い認識結果を得ら
れ、また、認識結果の修正操作が削減でき処理時間を短
縮できる。
【図面の簡単な説明】
【図1】本発明の第1の実施例の文書読取装置の構成を
示すブロック図である。
【図2】第1の実施例の文書読取装置の動作を示す処理
フローチャートである。
【図3】第1の実施例における手書き修正部分の指定方
法を示す説明図である。
【図4】第1の実施例の手書き修正部分の種類の選択メ
ニューを示す説明図である。
【図5】第1の実施例の手書き修正部分の文字認識方法
の説明図である。
【図6】手書き修正部分の検出処理フローチャートであ
る。
【図7】手書き修正部分の検出処理フローチャートであ
る。
【図8】手書き修正部分の検出処理フローチャートであ
る。
【図9】手書き修正部分の検出処理例の説明図である。
【図10】第3の実施例の認識結果の表示例を示す説明
図である。
【図11】従来の文書読取装置の問題点の説明図であ
る。
【符号の説明】
1 画像入力部 2 画像メモリ 3 レイアウト解析部 4 レイアウトメモリ 5 文字認識部 6 認識メモリ 7 結果出力部 10 表示部 11 操作部 12 制御部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 記録媒体上に記録された文字あるいはイ
    メージを走査して画像データを作成してこれを格納する
    画像入力手段と、 前記画像入力手段にて作成され格納されている画像デー
    タからレイアウトデータを作成してこれを格納するレイ
    アウト解析手段と、 前記レイアウト解析手段にて作成され格納されているレ
    イアウトデータに従い、前記画像入力手段にて作成され
    格納されている画像データの文字画像を認識してこれを
    格納する文字認識手段とを備え、 前記レイアウト解析手段は、オペレータにより指示され
    た修正部分およびその修正内容に応じた修正データを組
    み込んだレイアウトデータを作成および格納する手段を
    備え、 前記文字認識手段は、前記レイアウト解析手段にて作成
    された修正データが組み込まれたレイアウトデータに応
    じて画像データから認識データを作成する手段を備えた
    ことを特徴とする文書読取装置。
  2. 【請求項2】 請求項1記載の文書読取装置において、 前記レイアウト解析手段は、前記画像データの修正部分
    および修正内容を検出して修正データを作成する機能を
    備えていることを特徴とする文書読取装置。
  3. 【請求項3】 請求項1または2記載の文書読取装置に
    おいて、 前記文字認識手段は、前記修正データに従い修正部分お
    よび修正内容を明示できる認識データを作成する機能を
    備えているとともに、 前記文字認識手段で認識された修正部分および修正内容
    を明示できる認識データと前記画像メモリに格納された
    画像データを表示して、両者を比較して確認・修正を行
    える認識結果確認・修正手段を備えたことを特徴とする
    文書読取装置。
JP7160315A 1995-06-27 1995-06-27 文書読取装置 Pending JPH0916712A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7160315A JPH0916712A (ja) 1995-06-27 1995-06-27 文書読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7160315A JPH0916712A (ja) 1995-06-27 1995-06-27 文書読取装置

Publications (1)

Publication Number Publication Date
JPH0916712A true JPH0916712A (ja) 1997-01-17

Family

ID=15712304

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7160315A Pending JPH0916712A (ja) 1995-06-27 1995-06-27 文書読取装置

Country Status (1)

Country Link
JP (1) JPH0916712A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010122853A (ja) * 2008-11-19 2010-06-03 Panasonic Corp 撮像装置
JP2020160629A (ja) * 2019-03-25 2020-10-01 富士ゼロックス株式会社 情報処理装置及びプログラム
JP2023044206A (ja) * 2021-09-17 2023-03-30 株式会社東芝 文字認識装置、文字認識方法、および文字認識プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010122853A (ja) * 2008-11-19 2010-06-03 Panasonic Corp 撮像装置
JP2020160629A (ja) * 2019-03-25 2020-10-01 富士ゼロックス株式会社 情報処理装置及びプログラム
JP2023044206A (ja) * 2021-09-17 2023-03-30 株式会社東芝 文字認識装置、文字認識方法、および文字認識プログラム

Similar Documents

Publication Publication Date Title
US5717794A (en) Document recognition method and system
US6466694B2 (en) Document image processing device and method thereof
US5191612A (en) Character recognition system
JPS63155386A (ja) 帳票デ−タ読取装置
JP2835178B2 (ja) 文書読取装置
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP3936436B2 (ja) 表認識方法
JPH0916712A (ja) 文書読取装置
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JPH08329187A (ja) 文書読取装置
JPH10171920A (ja) 文字認識装置、その文字認識方法およびその記録媒体
JP3794285B2 (ja) 光学式文字読取装置
JPH0991371A (ja) 文字表示装置
JP2887823B2 (ja) 文書認識装置
US8432555B2 (en) Image processing apparatus, image processing method, computer-readable medium and computer data signal
JPH08137987A (ja) 光学式文字読取装置
JPH07239901A (ja) 光学式読み取り装置における文字修正方法
JP2683711B2 (ja) 文字・記号データの認識・修正方法
JPH1021336A (ja) 文字列種別判定方法及び装置
JP3221969B2 (ja) 文字認識装置
JP2890788B2 (ja) 文書認識装置
JPH09185675A (ja) 様式解析方法
JP3077580B2 (ja) 文字読取装置
JPH04293185A (ja) ファイリング装置
JPS61198375A (ja) 光学的文字読取装置