JPH06259594A - 光学的読取りデータの処理方法及び同装置 - Google Patents

光学的読取りデータの処理方法及び同装置

Info

Publication number
JPH06259594A
JPH06259594A JP5049457A JP4945793A JPH06259594A JP H06259594 A JPH06259594 A JP H06259594A JP 5049457 A JP5049457 A JP 5049457A JP 4945793 A JP4945793 A JP 4945793A JP H06259594 A JPH06259594 A JP H06259594A
Authority
JP
Japan
Prior art keywords
image data
data
character
buffer
read data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5049457A
Other languages
English (en)
Inventor
Ryoji Narutomi
富 良 治 成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP5049457A priority Critical patent/JPH06259594A/ja
Publication of JPH06259594A publication Critical patent/JPH06259594A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 【構成】 OCR1で読取ったデータのうち文字認識で
きなかった部分があったか否かを判断し(S102)、
YESの場合にイメージデータの切出し処理を行う。こ
れは、まず、その読取りデータの文字認識できなかった
部分を表示し(S104)、次いでその表示画面におい
て切出し範囲を指定する(S105〜S107)。その
後、バッファ205内のデータのうちこの切出し範囲内
に相当する部分をイメージデータとして専用バッファ2
07に保存する。これにより、OCRで読取ったデータ
のうち文字コード化できたものの他、認識できなかった
部分もイメージデータとして保存できる。 【効果】 文字と写真・地図等を含むデータを取る場合
でも、OCRとイメージスキャナとの両方の操作は不要
になり、操作員の作業負担を軽減できる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はスキャナで取込んだ画像
データの有効利用化を図った光学的読取りデータの処理
方法及び同装置に関するものである。
【0002】
【従来の技術】紙面などに書かれた手書きや印刷文字を
光学的に認識し、コンピュータに入力する装置としてO
CRが知られている。原理は暗色の文字に光を当て、反
射光を数十個のマス目に分割し、その目を解析して
“0”、“1”の文字コードに変えるというものであ
る。
【0003】このOCRによる文字認識は字形が一定な
ものほど容易であり、現在では英字・数字の印刷文字の
OCRはかなり普及している。初期の手書き数字のOC
Rとしての例は、郵便番号読取り区分機がある。また、
英字・数字のOCR用印刷文字はJISで標準化されて
いる。これからのOCRは、手書き漢字の読取りが開発
の中心であり、座標入力装置を用いた手書き文字入力装
置との並行してその進歩が期待されている。
【0004】
【発明が解決しようとする課題】ところで、OCRによ
り取込まれるデータには認識対象となる文字画像データ
の他に認識対象とはならないイメージデータも含まれ
る。しかし、OCRではそのイメージデータは処理の対
象にはならないため、せっかく取込まれたデータでもカ
ットされるだけであった。
【0005】よって、そのイメージデータが作業者にと
って必要な場合、改めてイメージスキャナにより取込む
必要がある。例えば、名刺には地図や写真が付随してい
る場合がある。このような名刺のデータを取っておく場
合、その地図や写真のデータも同時に保存しておきたい
ものであるが、地図や写真などのイメージデータはOC
Rでは処理対象にはならず、カットされてしまうため、
それらは改めてイメージスキャナで読込むことになる。
OCRもイメージスキャナも対象を画像として取込む点
では同じであり、OCRとイメージスキャナとの両方を
操作しなければならないことは2度手間で非効率な作業
と言わざるを得ない。
【0006】本発明は、この問題点に鑑みてなされたも
ので、その目的とするところは、スキャナで取込んだ画
像データを文字認識データ及びイメージデータの両方に
利用できるようにした画像データ処理方法及び同装置を
提供することにある。
【0007】
【課題を解決するための手段】本発明の光学的読取りデ
ータの処理方法は、光学的読取りデータのうち文字認識
できなかった部分の存在を検知するステップと、上記光
学的読取りデータのうち少なくとも上記文字認識できな
かった部分を表示するステップと、その表示画面におい
て切出し範囲を指定するステップと、上記光学的読取り
データのうひこの表示画面の切出し範囲内に相当する部
分をイメージデータとして保存するステップとを含んで
いることを特徴とする。
【0008】また、本発明の同処理装置は、表示手段
と、光学的読取りデータのうち文字認識できなかった部
分の存在を検知する検知手段と、その検知信号に応答し
て上記光学的読取りデータのうち少なくとも上記文字認
識できなかった部分を上記表示手段に表示させるととも
に、その表示画面において切出し範囲の指定を行うため
のカーソルを表示させる表示制御手段と、上記光学的読
取りデータのうひこの表示画面の切出し範囲内に相当す
る部分をイメージデータとして保存するイメージデータ
保存手段とを備えていることを特徴としている。
【0009】
【作用】本発明によれば、光学的に読取ったデータのう
ち文字コード化できたものは勿論のこと、その他の部分
もイメージデータとして保存することができるため、O
CRで取込んだ画像データを文字データ及びイメージデ
ータの両方に利用可能となり、文字と写真・地図を含む
名刺などを対象にしてその全体のデータを取っておくよ
うな場合でも、OCR装置による操作とイメージスキャ
ナによる操作との2度手間はなくなり、操作員の作業負
担を軽減することができることとなる。
【0010】
【実施例】以下に本発明の実施例について図面を参照し
つつ説明する。
【0011】まず、図2は本発明の一実施例に係るOC
Rデータ処理が組込まれる情報処理システムの構成を示
すものである。
【0012】この図において、1はOCR装置であり、
このOCR装置1は読取り部101と読取りデータバッ
ファ102と文字認識部103と辞書104とを有して
いる。読取り部101はスキャナにあたる部分で、その
出力データはバッファ102にパターンとして保持され
る。文字認識部103は、このバッファ102内のパタ
ーンデータについて辞書104を参照し、そのパターン
が示す文字種を認識し、その文字コードを保持するとと
もに、認識出来なかったパターンがあったときはその事
実を示すエラーフラグを保持しておく。インターフェー
ス部105はOCR装置1と次述するホストマシン2と
の間のデータ転送を担うものである。
【0013】ホストマシン2はOCR装置1からデータ
を受取る側でワープロ、パソコン等のことであり、制御
部(CPU・プログラムROM・ワークエリアRAM)
201と表示部202と切出し指定部203とから大略
構成されている。
【0014】制御部201はインターフェース部204
と受信データバッファ205と文字コードバッファ20
6とイメージデータバッファ207と切出し制御部20
8とを有する。
【0015】インターフェース部204はOCR1から
のデータを受信する部分であり、その受信データは全て
バッファ205に一旦格納され、その受信したデータの
うち文字コードのみをバッファ206に移される。
【0016】表示部202は、LCD、CRT等のこと
であり、少なくともイメージを表示する機能を持つもの
とされ、ここではバッファ205内のスキャナデータを
表示する。
【0017】切出し指定部203は、キーボード、マウ
ス、ペン等のことで、表示部202で表示された部分の
切出し範囲を指定するための機能を持つもので、切出し
制御部208は、この切出し指定部203からの指示に
従ってイメージデータ切出しのための制御、具体的に
は、表示部202上での切出し範囲の始点を指定せよ等
の切出し操作メッセージの表示制御、切出し範囲の表示
制御、指定切出し範囲のイメージデータをイメージデー
タバッファ207に格納する制御などを行うものであ
る。
【0018】図1はそのイメージデータ切出し制御の処
理を含む制御部201のOCR出力データの処理内容を
示すものである。
【0019】ステップS101ではOCR装置1からの
文字コード受取りの制御を行うもので、まず、OCR装
置1へ文字コード送信要求を送る。すると、OCR装置
1から文字コードが送られてくるため、それを受信し、
バッファ205を介してバッファ206へ保存する。な
お、前述したエラーフラグもお、この文字コードに伴っ
て送信されてくる。
【0020】続いて、ステップS102ではそのエラー
フラグの確認により文字認識できなかった部分があった
か否かの判定を行う。認識できなかった部分がなかった
場合には処理は終了となる。
【0021】ステップS102での判断の結果、認識で
きなかった部分が存在した場合にはステップS103へ
移る。ここでは、OCR装置1からのイメージデータの
受取りを行う。すなわち、OCR装置1に対してイメー
ジデータの送信要求を出す。すると、OCR装置1から
認識できなかった部分のデータを送ってくるため、これ
を受信してバッファ205に保存する。
【0022】次いで、ステップS104で切出し制御部
208を起動し、バッファ205内のイメージデータを
表示部202に表示させる。その後、切出し制御部20
8の処理に相当するステップ105〜S108を実行す
る。
【0023】ステップS105では表示部202上にク
ロスカーソルを表示する。次いで、ステップS106に
おいて、切出し範囲の始点についてのキー入力を受付け
る。つまり、まず切出し範囲の始点を指定せよ、という
メッセージを表示部202上に表示する。操作員は、そ
のメッセージに応答して切出し指定部203を通じてそ
の始点を指示入力する。切出し制御部208はその入力
を受付け、始点の確定を表示部202上に表示する。続
いて、ステップS107で切出し範囲の終点についての
キー入力を受付ける処理を行うこととなり、まず切出し
範囲の終点を指定せよ、というメッセージを表示部20
2上に表示する。操作員は、そのメッセージに応答して
切出し指定部203を通じその終点を指示入力する。切
出し制御部208はその入力を受付け、切出し範囲の終
点を表示部202上に表示する。その後、ステップS1
08で切出し範囲の始点・終点座標に基づいてバッファ
205よりデータを切出し、その切出したデータをバッ
ファ207に格納し、処理を終了させることとなる。
【0024】例えば、図3に示すような名刺301を対
象としてOCR装置1で読込み、その文字パターン部分
302〜304が認識され、写真部分305が認識不可
でエラーフラグが立ったとする。
【0025】OCR装置1はホストマシン2からの文字
コード送信要求に応答してバッファ102で保持してい
た文字コード及びエラーフラグをホストマシン2へ送信
する。するとホストマシン2からステップS102の判
断の結果でパターン送信要求が来るため、OCR装置1
はパターンデータを順次ホストマシン2へ送信する。ホ
ストマシン2はバッファ205で一時的に保持していた
データを表示部202へ表示する。この際、OCR装置
1で認識できなかった部分である写真部分305だけを
表示しても良いし、文字パターン部分302〜304も
含む全体を表示しても良い。
【0026】ホストマシン2は次に切出し範囲を操作員
に決定してもらうために、切出し制御部208により表
示部202上の画面上の座標とバッファ205の対応付
け及びカーソルCを表示制御し、始点306/終点30
7の決定の指定を受け付ける。始点/終点が決定する
と、その範囲308の部分を切出し、バッファ207に
記憶させることとなる。
【0027】このように本実施例によれば、OCR装置
1で読取ったデータのうち文字コード化できたものは勿
論のこと、その他の部分もイメージデータとして保存す
ることができる。したがって、OCR装置1で取込んだ
画像データを文字データ及びイメージデータの両方に利
用可能となり、文字と写真・地図を含む名刺などを対象
にしてその全体のデータを取っておくような場合でも、
OCR装置による操作とイメージスキャナによる操作と
の2度手間はなくなり、操作員の作業負担を軽減するこ
とができることとなる。
【0028】また、上記実施例のシステム構成を採用す
れば、キーボード等の大きな入力デバイスやディスプレ
イ等はホストマシン側に在れば足りるため、OCRをシ
ンプルなものにすることができる。
【0029】なお、上記実施例では、OCR装置1にお
いて文字認識できなかったデータが存在したときのエラ
ーフラグによりホストマシン2は自動的にイメージデー
タの切出し制御に入るようになっいるが、例えば、表示
部202上にエラーが在った旨の表示をまず行い、操作
員に切出しを行うかの指示を貰ってから切出し制御に移
るようにしても良い。
【0030】また、上記実施例のステップS108の後
ろに、まだ切出したいエリアがあるかどうかの指定を受
付ける処理を追加し、YESの場合にはステップS10
5に戻り、NOの場合に終了となるように構成し、複数
の切出し範囲に別けてイメージデータを保存できるよう
にすることも可能である。
【0031】更に、保存したイメージデータは外字パタ
ーン用などに加工して利用することも考えられる。
【0032】
【発明の効果】以上説明したように本発明によれば、光
学的に読取ったデータのうち文字コード化できたものは
勿論のこと、その他の部分もイメージデータとして保存
することができるため、OCRで取込んだ画像データを
文字データ及びイメージデータの両方に利用可能とな
り、文字と写真・地図を含む名刺などを対象にしてその
全体のデータを取っておくような場合でも、OCR装置
による操作とイメージスキャナによる操作との2度手間
はなくなり、操作員の作業負担を軽減することができる
こととなる。
【図面の簡単な説明】
【図1】本発明の一実施例に係るOCRデータの処理内
容を示すフローチャート。
【図2】図1に示す処理を行うデータ処理システムの構
成を示すブロック図。
【図3】図1、図2に示す装置によるイメージデータ切
出しの対象となる一つの読取り画像データの例を示す説
明図。
【符号の説明】
1 OCR装置 101 読取り部 102 読取りデータバッファ 103 文字認識部 104 辞書 105 インターフェース部 2 ホストマシン 201 制御部 202 表示部 203 切出し指定部 204 インターフェース部 205 受信データバッファ 206 文字コードバッファ 207 イメージデータバッファ 208 切出し制御部 S102 文字認識できなかった部分の存在を検知する
ステップ S104 文字認識できなかった部分を表示するステッ
プ S105〜S107 切出し範囲を指定するステップ S108 表示画面の切出し範囲内に相当するデータを
イメージデータとして保存するステップ

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】光学的読取りデータのうち文字認識できな
    かった部分の存在を検知するステップと、 前記光学的読取りデータのうち少なくとも前記文字認識
    できなかった部分を表示するステップと、 その表示画面において切出し範囲を指定するステップ
    と、 前記光学的読取りデータのうひ該表示画面の切出し範囲
    内に相当する部分をイメージデータとして保存するステ
    ップとを含んでいる光学的読取りデータの処理方法。
  2. 【請求項2】表示手段と、 光学的読取りデータのうち文字認識できなかった部分の
    存在を検知する検知手段と、 その検知信号に応答して前記光学的読取りデータのうち
    少なくとも前記文字認識できなかった部分を前記表示手
    段に表示させるとともに、その表示画面において切出し
    範囲の指定を行うためのカーソルを表示させる表示制御
    手段と、 前記光学的読取りデータのうひ該表示画面の切出し範囲
    内に相当する部分をイメージデータとして保存するイメ
    ージデータ保存手段とを備えている光学的読取りデータ
    の処理装置。
JP5049457A 1993-03-10 1993-03-10 光学的読取りデータの処理方法及び同装置 Pending JPH06259594A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5049457A JPH06259594A (ja) 1993-03-10 1993-03-10 光学的読取りデータの処理方法及び同装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5049457A JPH06259594A (ja) 1993-03-10 1993-03-10 光学的読取りデータの処理方法及び同装置

Publications (1)

Publication Number Publication Date
JPH06259594A true JPH06259594A (ja) 1994-09-16

Family

ID=12831673

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5049457A Pending JPH06259594A (ja) 1993-03-10 1993-03-10 光学的読取りデータの処理方法及び同装置

Country Status (1)

Country Link
JP (1) JPH06259594A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007034444A (ja) * 2005-07-25 2007-02-08 Konica Minolta Business Technologies Inc 画像形成装置、後処理警告方法および後処理設定方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007034444A (ja) * 2005-07-25 2007-02-08 Konica Minolta Business Technologies Inc 画像形成装置、後処理警告方法および後処理設定方法

Similar Documents

Publication Publication Date Title
US6782144B2 (en) Document scanner, system and method
US4933979A (en) Data reading apparatus for reading data from form sheet
JPH06274680A (ja) 文書認識方法およびシステム
JP3683925B2 (ja) 電子ファイリング装置
US5233672A (en) Character reader and recognizer with a specialized editing function
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
EP0519713B1 (en) Character input method and apparatus
US5854860A (en) Image filing apparatus having a character recognition function
JPH06103411A (ja) 文書読取装置
JPH06259594A (ja) 光学的読取りデータの処理方法及び同装置
JPH08107495A (ja) 入出力一体型情報操作装置
JPH07152856A (ja) 光学的文字読取装置
JPS5949671A (ja) 光学的文字読取装置
JP2877380B2 (ja) 光学的文字読取装置
JPH04348475A (ja) 画像情報検索方法及びその装置
JPS61150081A (ja) 文字認識装置
JP2003099709A (ja) 誤読文字修正方法及び光学的文字認識装置
JPH04123262A (ja) 表形式データ処理装置
JP3045086B2 (ja) 光学式文字読取方法および装置
JP3310063B2 (ja) 文書処理装置
JPS63155385A (ja) 光学文字読取装置
JPH07111729B2 (ja) 読取装置
JPH08263591A (ja) 文字認識装置及び方法
JPH04293185A (ja) ファイリング装置
JPH07111728B2 (ja) 帳票読み取り処理装置