JP2000059588A - 画像処理装置 - Google Patents

画像処理装置

Info

Publication number
JP2000059588A
JP2000059588A JP10227965A JP22796598A JP2000059588A JP 2000059588 A JP2000059588 A JP 2000059588A JP 10227965 A JP10227965 A JP 10227965A JP 22796598 A JP22796598 A JP 22796598A JP 2000059588 A JP2000059588 A JP 2000059588A
Authority
JP
Japan
Prior art keywords
image
image data
data
document
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10227965A
Other languages
English (en)
Inventor
Takenori Izuhara
武典 出原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Minolta Co Ltd
Original Assignee
Minolta Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Minolta Co Ltd filed Critical Minolta Co Ltd
Priority to JP10227965A priority Critical patent/JP2000059588A/ja
Publication of JP2000059588A publication Critical patent/JP2000059588A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Storing Facsimile Image Data (AREA)

Abstract

(57)【要約】 【課題】 文書を読み取って得られた画像データに、こ
の画像データを検索するためのワードを表す符号化デー
タを自動的に付加することができる画像処理装置を提供
する。 【解決手段】 紙面に表わされた文書を画像入力手段2
によって部分的に順次光学的に読み取って得られた各画
像データが、それぞれ文字画像に相当するか否かを判断
する第1の判定手段1を備える。第1の判定手段1によ
って文字画像に相当すると判断された画像データを順次
蓄える画像メモリ6を備える。画像メモリ6に蓄えられ
た画像データが検索用のワードを作成するのに必要な一
定量に達したか否かを判断する第2の判定手段1を備え
る。画像メモリ6に蓄えられた画像データが上記一定量
に達したと判断されたとき、上記一定量に達した画像デ
ータを文字認識して上記符号化データを得る文字認識手
段1を備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は画像処理装置に関
する。より詳しくは、文書を読み取って得られた画像デ
ータに、この画像データを検索するためのワードを表す
符号化データを付加する画像処理装置に関する。
【0002】
【従来の技術】一般に、文書を画像データとして保存す
る場合、文書を光学的に読み取って得られた画像データ
に、この画像データを検索するための検索用ワードが設
定されている。
【0003】従来、この検索用ワードを設定する作業
は、ユーザが文書の一部分を読み取ってキーボードで入
力することによってなされ、入力された文書が検索用ワ
ードとして符号化され、対応する画像データに付加され
た状態で記憶装置に格納されるようになっていた。
【0004】
【発明が解決しようとする課題】しかしながら、上記の
形態では、ユーザの入力作業が煩わしく、保存する文書
のページ数が多くなるにつれて入力ミスも生じてくる。
また、文書を読み取って画像データを得る作業と、上記
検索用ワードを設定する作業とが別々に独立しており、
最終的にデータを得るまでの作業に手間がかかるといっ
た問題もある。
【0005】そこで、この発明の目的は、文書を読み取
って画像データを得ると同時に、併せて、この画像デー
タを検索するための検索用ワードを表す符号化データを
自動的に付加することのできる画像処理装置を提供する
ことにある。
【0006】
【課題を解決するための手段】上記目的を達成するた
め、請求項1に記載の画像処理装置は、文書を読み取っ
て得られた画像データと、この画像データを検索するた
めのワードを表す符号化データとを記憶装置に格納する
処理を行う画像処理装置であって、紙面に表わされた文
書を部分的に順次光学的に読み取って画像データを得る
画像入力手段と、上記画像入力手段によって得られた各
画像データがそれぞれ文字画像に相当するか否かを判断
する第1の判定手段と、上記第1の判定手段によって文
字画像に相当すると判断された画像データを順次蓄える
画像メモリと、上記画像メモリに蓄えられた画像データ
が上記ワードを作成するのに必要な一定量に達したか否
かを判断する第2の判定手段と、上記画像メモリに蓄え
られた画像データが上記一定量に達したと判断されたと
き、上記一定量に達した画像データを文字認識して上記
符号化データを得る文字認識手段を備えたことを特徴と
する。
【0007】ここで、「文書」には、文字によって構成
される文章のほか、写真、図面などの構成要素が含まれ
る。
【0008】また、文章を構成する「文字」には、例え
ばJIS(日本工業標準規格)の図形文字用符号表(J
IS X 0208−1983)に挙げられているよう
に、かな、漢字、英字、数字、間隔(スペース)、一定
の記号(具体的には、+−*/=<>()「」など)な
どが含まれる。
【0009】また、「文字画像」とは「文字」を表す画
像を意味する。
【0010】この請求項1の画像処理装置では、画像入
力手段が、紙面に表わされた文書を部分的に順次光学的
に読み取って画像データを得る。第1の判定手段は、上
記画像入力手段によって得られた各画像データがそれぞ
れ文字画像に相当するか否かを判断する。上記第1の判
定手段によって文字画像に相当すると判断された画像デ
ータは順次画像メモリに蓄えられてゆく。そして、第2
の判定手段によって、上記画像メモリに蓄えられた画像
データが検索用のワードを作成するのに必要な一定量に
達したか否かが判断される。上記画像メモリに蓄えられ
た画像データが上記一定量に達したと判断されたとき、
文字認識手段は、上記一定量に達した画像データを文字
認識してその符号化データを得る。この符号化データ
は、検索用のワードとして、上記画像入力手段によって
得られた画像データと対応させて記憶装置に格納され
る。このようにして、文書を読み取って得られた画像デ
ータに、この画像データを検索するためのワードを表す
符号化データが自動的に付加される。
【0011】請求項2に記載の画像処理装置は、請求項
1に記載の画像処理装置において、上記画像入力手段
は、上記文書をライン状に順次読み取るラインセンサを
含み、上記画像入力手段によって得られたライン状の画
像データを上記ライン毎に圧縮する画像圧縮手段を備
え、上記符号化データとともに上記画像圧縮手段による
圧縮後の画像データを上記記憶装置に格納することを特
徴とする。
【0012】この請求項2の画像処理装置によれば、記
憶装置に圧縮後の画像データが格納されるので、上記記
憶装置の容量が少なくて済み、画像データが効率良く保
存される。
【0013】請求項3に記載の画像処理装置は、請求項
2に記載の画像処理装置において、上記画像入力手段
は、文書の行方向と上記ラインセンサの長手方向とを一
致させた状態で、上記文書をライン状に順次読み取るこ
とを特徴とする。
【0014】この請求項3の画像処理装置によれば、さ
らに画像データが効率よく保存される。
【0015】請求項4に記載の画像処理装置は、請求項
3に記載の画像処理装置において、上記第1の判定手段
は、上記各画像データが文字画像に相当するか否かを、
上記画像圧縮手段による上記ライン毎の画像データの圧
縮率に基づいて判断することを特徴とする。
【0016】画像データが文字画像に相当するものであ
れば、冗長度が比較的低いことから、その圧縮率は低く
なる。一方、画像データが文字画像以外の例えば写真画
像であれば、冗長度が比較的高いことから、その圧縮率
は高くなる。ここで、この請求項4の画像処理装置で
は、上記第1の判定手段は、上記各画像データが文字画
像に相当するか否かを、上記画像圧縮手段による上記ラ
イン毎の画像データの圧縮率に基づいて判断する。した
がって、上記各画像データが文字画像に相当するか否か
が、上記ライン毎に確実に判断される。
【0017】請求項5に記載の画像処理装置は、請求項
1に記載の画像処理装置において、上記画像メモリに蓄
えられた画像データが上記一定量に達するまでに、上記
第1の判定手段によって或る画像データが文字画像に相
当しないと判断されたとき、上記画像メモリに既に蓄え
られている画像データをクリアする制御手段を備えたこ
とを特徴とする。
【0018】この請求5の画像処理装置では、上記画像
メモリに蓄えられた画像データが上記一定量に達するま
でに、上記第1の判定手段によって或る画像データが文
字画像に相当しないと判断されたとき、制御手段によっ
て、上記画像メモリに既に蓄えられている画像データが
クリアされる。すなわち、上記画像メモリに蓄えられた
画像データが上記一定量に達するまでに、上記画像入力
手段が順次読み取る文書の途中に文字でない部分、例え
ば写真からなる部分が現れたとき、上記画像メモリに既
に蓄えられている画像データがクリアされる。そして、
上記写真部分の読み取り終了後、上記画像入力手段が読
み取った次の文字部分の画像データから再び上記画像メ
モリに順次蓄えられてゆく。この結果、上記画像メモリ
に蓄えられる上記一定量の画像データは、上記文書内の
連続した文字部分の画像データとなる。したがって、文
字認識手段が出力する検索用の符号化データとして、上
記文書内の一定量連続した文字部分を符号化したものが
得られる。
【0019】請求項6に記載の画像処理装置は、請求項
1に記載の画像処理装置において、上記画像入力手段に
よって文書1ページ分の読み取りが終了する毎に、その
ページの画像データに対応する符号化データを上記記憶
装置に格納するとともに、上記画像メモリをクリアする
ことを特徴とする。
【0020】この請求項6の画像処理装置によれば、文
書の各ページの画像データに対してそれぞれ一つの検索
用の符号化データが付加される。
【0021】請求項7に記載の画像処理装置は、請求項
1に記載の画像処理装置において、上記画像入力手段に
よって文書全ページの読み取りが終了したとき、その全
ページの画像データに対応して一つの符号化データを格
納することを特徴とする。
【0022】この請求項7の画像処理装置によれば、文
書の全ページの画像データに対して一つの検索用の符号
化データが付加される。
【0023】
【発明の実施の形態】以下、この発明の画像処理装置の
実施の形態を詳細に説明する。
【0024】図1は一実施形態の画像処理装置のブロッ
ク構成を示している。この画像処理装置は、本装置全体
を制御するCPU(中央演算処理装置)1と、画像入力
手段としての読み取り部2およびAD変換部3と、HD
D(ハード・ディスク・ドライブ)からなる大容量記憶
装置4と、操作パネル5と、RAM(ランダム・アクセ
ス・メモリ)からなる画像メモリ6と、ROM(リード
・オンリ・メモリ)からなるシステムメモリ7と、プリ
ンタ部8を備えている。
【0025】読み取り部2は、文書をライン状に順次読
み取るラインセンサを含んでいる。そして、画像読み取
りの際に、文書の行方向と、このラインセンサの長手方
向とが一致された状態で文書が走査され、その結果とし
て文書がライン状に順次光学的に読み取られ、読み取り
部2から画像データが出力されるようになっている。な
お、読み取り部2の読み取りラインピッチは約0.04
mmである。AD変換部3は、読み取り部2によって得
られたアナログの画像データをAD(アナログ−デジタ
ル)変換および2値化してデジタルの画像データとす
る。
【0026】大容量記憶装置4は、文書を読み取って得
られた画像データと、この画像データを検索するための
検索用ワードを表す符号化データ(以下、適宜「検索用
データ」という。)とを対応させて格納することができ
る。例えば図13(a)に示すように、大容量記憶装置4
内のアドレス「×〇△××」のヘッダ部11に文書名1
3と画像データのアドレス14とが格納され、それに続
くデータ部12に検索用データ15が格納される。ま
た、図13(b)に示すように、大容量記憶装置4内のア
ドレス「〇××△〇」のヘッダ部21に上記文書名23
と上記検索用データのアドレス24とが格納され、それ
に続くデータ部22に画像データ25が格納される。な
お、文書名13、23は、文書読み取りの際に操作パネ
ル5に設けられているキーボードから入力されるように
なっているが、それに代え、各文書を識別するために自
動的に付与される一連の連続番号であってもよい。
【0027】図1中に示す操作パネル5は、ユーザが、
読み取り部2による文書の読み取り開始を指示する読み
取り開始命令や、大容量記憶装置4に格納された画像デ
ータを呼び出すための検索用ワードを入力するために用
いられる。また、この操作パネル5は、大容量記憶装置
4から呼び出された画像データを表示するための図示し
ない液晶表示装置を有している。
【0028】画像メモリ6は、画像データを一時的に記
憶することができる。
【0029】システムメモリ7は、CPU1の処理フロ
ーを定めたプログラムや、画像データを文字認識(OC
R)するためのプログラム、大容量記憶装置4に格納さ
れた画像データを検索するためのプログラムを格納して
いる。
【0030】プリンタ部8は、大容量記憶装置4から呼
び出された画像データを印刷することができる。
【0031】図2は、文書を読み取って画像データを得
るとともに、その画像データに検索用データを付加する
ための第1の処理例を示している。
【0032】この第1の処理例では、以下に述べるよう
に、文書の全ページの画像データに対して一つの検索用
データを付加する。また、検索用データとして、文書内
で文字が4行分連続した部分を符号化したものを採用す
る。
【0033】図3(a)または同図(b)に示すように、複数
の紙に表された文書を読み取るものとする。この例で
は、文書の第1ページに、文字で構成された文章の行C
と、写真部分Pとが含まれている。なお、文書の改行ピ
ッチは約5〜10mmの範囲内にある。
【0034】 図2のステップS1で、ユーザが操作
パネル5を通して読み取り開始命令を入力すると、CP
U1は画像メモリ6をクリアする。これとともに、読み
取り部2が第1ページの文書を光学的に1ライン分(第
1ラインから始める)読み取ってその画像データを出力
する(S2)。続いて、AD変換部3が、読み取り部2
によって得られたアナログの画像データをAD変換およ
び2値化してデジタルの画像データとする(S3)。
【0035】 次に、公知のデータ圧縮法により、読
み取り部2によって得られた1ライン分の画像データを
圧縮する(S4)。このとき、画像データが文字画像に
相当するものであれば、冗長度が比較的低いことから、
その圧縮率は低くなる。一方、画像データが写真画像で
あれば、冗長度が比較的高いことから、その圧縮率は高
くなる。続いて、この圧縮後の1ライン分の画像データ
を大容量記憶装置4に保存する(S5)。
【0036】 次に、ステップS6で、検索用データ
が作成済みであるか否かを判断する。第1ラインの画像
データを処理している段階では、検索用データは未だ作
成されていないので、ステップS9に進む。
【0037】 ステップS9では、1ライン分の画像
データの圧縮率がn%以下であるか否かを判断する。な
お、判断基準値(n%)として、文字画像と写真画像と
を区別できるような適切な値を予め設定しておくものと
する。ここで、判断対象のラインの画像データの圧縮率
がn%を超えていれば、そのラインは写真画像であると
考えて、画像メモリ6をクリアし(S16)、全ページ
の読み取りが終了していないことを確認した上で(S
7)、ステップS2へ戻る。
【0038】 一方、ステップS9で、判断対象のラ
インの画像データの圧縮率がn%以下であれば、そのラ
インは文字画像であると考えて、上記圧縮法とは逆の公
知の伸長法により、その1ライン分の画像データを元の
長さに伸長する(S10)。続いて、この伸長後の1ラ
イン分の画像データを画像メモリ6に記憶させる(S1
1)。次に、画像メモリ6に蓄えられた画像データの容
量が一定容量、この例では上記文書における4行分の文
字画像データに相当する容量に達したか否かを判断する
(S12)。なお、上記一定容量は、操作パネル5を操
作することにより、ユーザによって任意に設定可能とさ
れてもよい。第1ラインの画像データを処理している段
階では、画像メモリ6に蓄えられた画像データは4行分
には達していないので、全ページの読み取りが終了して
いないことを確認した上で(S13)、ステップS2へ
戻る。
【0039】 ステップS7またはS13を経てステ
ップS2に戻ったら、読み取り部2が上記文書の次の光
学的な1ライン分を読み取り(S2)、上述のステップ
S3〜S5の処理を繰り返して、その1ライン分の画像
データを大容量記憶装置4に保存する。そして、検索用
データが未だ作成されていないことを確認した上(S
6)、全ページの読み取りが終了していない限り、上述
のステップS9,S16,S7の処理を実行して画像メ
モリ6をクリアした状態、またはステップS9〜S13
の処理を実行して画像メモリ6に幾つかのライン分の画
像データを蓄えた状態で、ステップS2に戻る。
【0040】 上記の処理を繰り返す過程で、画像
メモリ6に蓄えられた画像データが4行分に達した場合
(S12)は、その4行分に達した画像データを文字認
識してその符号化データを得る(S14)。続いて、こ
の符号化データを検索用データとして大容量記憶装置4
に格納する(S15)。次に、全ページの読み取りが終
了したか否かを判断する(S7)。全ページの読み取り
が終了していなければ、ステップS2〜S7の処理(途
中のステップS6では検索用データは作成済みと判断さ
れる)を繰り返して、文書全ページの圧縮後の画像デー
タを画像圧縮ファイルとして大容量記憶装置4に保存す
る。最後に、大容量記憶装置4内に、この画像圧縮ファ
イルと上記検索用データとを対応させた状態で保存する
(S8)。
【0041】このようにして、文書を読み取って得られ
た画像データに、この画像データのための検索用データ
を自動的に付加することができる。
【0042】なお、ステップS7,S13で文書の全ペ
ージの読み取りが終了したか否かを判断しているので、
文書の全ページの画像データに対して一つの検索用デー
タが付加される。
【0043】また、ステップS16で画像メモリ6をク
リアしている結果、画像メモリ6に蓄えられる4行分の
画像データは、上記文書内の最初に4行分連続した文字
部分の画像データとなる。例えば、図3(a)に示すよう
に、文書の第1ページの最上部に写真部分Pが存在し、
その下に文字行Cが4行以上連続している場合は、写真
部分Pに続く4行分の文章Dに相当する検索用データが
得られる。また、図3(b)に示すように、文書の第1ペ
ージの最上部に文字行Cが2行存在し、その下に写真部
分Pが続き、さらにその下に文字行Cが4行以上連続し
ている場合は、最上部の2行Cの画像データはステップ
S16でクリアされて、最終的には、写真部分Pに続く
4行分の文章Dに相当する検索用データが得られる。
【0044】 なお、上記の処理を繰り返す過程
で、ステップS9,S16,S7の処理を実行して画像
メモリ6をクリアした状態で全ページの読み取りが終了
した場合は、上記文書内に文字が4行分連続した部分が
存在しなかったわけであるから、検索用データを作成し
ないまま処理を終了する。
【0045】また、上記の処理を繰り返す過程で、ス
テップS9〜S13の処理を実行して画像メモリ6に1
〜3行分の画像データを蓄えた状態で全ページの読み取
り終了した場合は、その1〜3行分の画像データを文字
認識してその符号化データを得る(S14)。続いて、
この符号化データを検索用データとして大容量記憶装置
4に格納する(S15)。次に、全ページの読み取りが
終了したことを確認した上で(S7)、大容量記憶装置
4内に、文書全ページの画像圧縮ファイルとその検索用
データとを対応させた状態で保存する(S8)。
【0046】図4は、文書を読み取って画像データを得
るとともに、その画像データに検索用データを付加する
ための第2の処理例を示している。
【0047】この第2の処理例では、ステップS7A,
S13Aで文書の1ページ分の読み取りが終了したか否
かを判断して、文書の各ページの画像データに対してそ
れぞれ一つの検索用データを付加するようにしている。
この点が第1の処理例と異なっている。なお、前ページ
のデータの一部を使用して検索用データが作成されるよ
うな事態を避けるために、ページが変更されると画像メ
モリのデータをクリアすることとしている(S18)。
【0048】この結果、図5に示すように、例えば文書
の第1ページの最上部に写真部分Pが存在し、その下に
文字行Cが4行以上連続している場合は、写真部分Pに
続く4行分の文章Dに相当する検索用データが得られ
る。また、第2ページのように最上部から文字行Cが4
行以上連続し、下部に写真部分Pが存在する場合は、最
上部の4行分の文章Dに相当する検索用データが得られ
る。第3ページのように全面に文字行Cが存在する場合
は、最上部の4行分の文章Dに相当する検索用データが
得られる。第4ページのように最上部に文字行Cが2行
存在し、その下に写真部分Pが続き、さらにその下に文
字行Cが4行以上連続している場合は、最上部の2行C
の画像データはステップS16でクリアされて、最終的
には、写真部分Pに続く4行分の文章Dに相当する検索
用データが得られる。
【0049】図6は、文書を読み取って画像データを得
るとともに、その画像データに検索用データを付加する
ための第3の処理例を示している。
【0050】この第3の処理例では、図2におけるステ
ップS16を省略している。この点のみが第1の処理例
と異なっている。
【0051】この結果、画像メモリ6に蓄えられた画像
データが4行分に達するまでに、読み取り部2が順次読
み取る文書の途中に文字でない部分、例えば写真部分P
が現れたとしても、画像メモリ6に既に蓄えられている
画像データはクリアされず、上記写真部分Pの読み取り
終了後、読み取り部2が読み取った次の文字行Cの画像
データが画像メモリ6に順次追加的に蓄積されてゆく。
例えば図7(b)に示すように、文書の第1ページの最上
部に文字行Cが2行存在し、その下に写真部分Pが続
き、さらにその下に文字行Cが2行以上連続している場
合は、最上部の2行の文章部分D1と、写真部分Pに続
く2行の文章部分D2とを併せたのに相当する検索用デ
ータが得られる。なお、図7(a)に示すように、文書の
第1ページの最上部に写真部分Pが存在し、その下に文
字行Cが4行以上連続している場合は、第1の処理例の
結果と同様に、写真部分Pに続く4行分の文章Dに相当
する検索用データが得られる。
【0052】図8は、文書を読み取って画像データを得
るとともに、その画像データに検索用データを付加する
ための第4の処理例を示している。
【0053】この第4の処理例では、ステップS7A,
S13Aで文書の1ページ分の読み取りが終了したか否
かを判断して、文書の各ページの画像データに対してそ
れぞれ一つの検索用データを付加するようにしている。
また、図2におけるステップS16を省略している。こ
れらの点が第1の処理例と異なっている。なお、前ペー
ジのデータの一部を使用して検索用データが作成される
ような事態を避けるために、ページが変更されると画像
メモリのデータをクリアすることとしている(S1
8)。
【0054】この結果、図9に示すように、例えば文書
の第1ページの最上部に文字行Cが2行存在し、その下
に写真部分Pが続き、さらにその下に文字行Cが2行以
上連続している場合は、最上部の2行の文章部分D
1と、写真部分Pに続く2行の文章部分D2とを併せたの
に相当する検索用データが得られる。また、第2ページ
のように最上部から文字行Cが4行以上連続し、下部に
写真部分Pが存在する場合は、最上部の4行分の文章D
に相当する検索用データが得られる。第3ページのよう
に全面に文字行Cが存在する場合は、最上部の4行分の
文章Dに相当する検索用データが得られる。第4ページ
のように最上部に文字行Cが2行存在し、その下に写真
部分Pが続き、さらにその下に文字行Cが2行以上連続
している場合は、最上部の2行の文章部分D1と、スペ
ース行に続く2行の文章部分D2とを併せたのに相当す
る検索用データが得られる。
【0055】図10は、文書を読み取って画像データを
得るとともに、その画像データに検索用データを付加す
るための第5の処理例を示している。
【0056】この第5の処理例は、第2の処理例と同様
に、ステップS7A,S13Aで文書の1ページ分の読
み取りが終了したか否かを判断して、文書の各ページの
画像データに対してそれぞれ一つの検索用データを付加
するようにしている。また、ステップS12Aで画像メ
モリ6に蓄えられた画像データの容量が一定容量に達し
たか否かを、文書における副走査方向の長さ(この例で
は文書4行分に相当する領域を読み取るのに必要な副走
査方向の長さ)に基づいて判断している。なお、上記副
走査方向の長さは、読み取りライン数と比例関係にある
ことから、読み取りライン数に基づいて判断するように
してもよい。これらの点が第1の処理例と異なってい
る。なお、前ページのデータの一部を使用して検索用デ
ータが作成されるような事態を避けるために、ページが
変更されると画像メモリのデータをクリアすることとし
ている(S18)。
【0057】この結果、図11に示すように、例えば文
書の第1ページの最上部に写真部分Pが存在し、その下
に文字行Cが4行以上連続している場合は、写真部分P
に続く4行分の長さEに相当する検索用データが得られ
る。また、第2ページのように最上部から文字行Cが4
行以上連続し、下部に写真部分Pが存在する場合は、最
上部の4行分の長さEに相当する検索用データが得られ
る。第3ページのように全面に文字行Cが存在する場合
は、最上部の4行分の長さEに相当する検索用データが
得られる。第4ページのように最上部に文字行Cが2行
存在し、その下に写真部分Pが続き、さらにその下に文
字行Cが4行以上連続している場合は、最上部の2行C
の画像データはステップS16でクリアされて、最終的
には、写真部分Pに続く4行分の長さEに相当する検索
用データが得られる。
【0058】図12は、大容量記憶装置4に検索用デー
タとともに格納された画像データを呼び出す処理例を示
している。
【0059】 ユーザが操作パネル5を通して検索用
ワードを入力すると(S101)、CPU1は大容量記
憶装置4内の検索用データを検索して(S102)、入
力された検索用ワードと一致する検索用データがあるか
否かを判断する(S103)。ここで、入力された検索
用ワードと一致する検索用データがなければ、ステップ
S101へ戻って新たな検索用ワードの入力を待つ。一
方、入力された検索用ワードと一致する検索用データが
あれば、ステップS104に進んで、検索用データを特
定する。続いて、操作パネル5の表示画面にその検索デ
ータを表示する(S105)。
【0060】 ユーザは、操作パネル5の表示画面に
表示された検索用データを見て、意図した検索用データ
であれば「OK」キーを押下する(S106)。「O
K」キーが押下されると、CPU1は、表示された検索
用データに対応する画像データを大容量記憶装置4から
読み出す(S107)。これとともに、プリンタ部8は
その画像データをプリント出力する(S108)。
【0061】 一方、ステップS106で、操作パネ
ル5の表示画面に表示された検索用データが意図しない
検索用データであれば、ユーザは「NG」キーを押下す
る。すると、CPU1は、ユーザから検索を中止するか
否かの指示を受けるために、操作パネル5の表示画面に
「検索中止?」と表示させる。ここで、ユーザが「検索
中止」キーを押下すると、CPU1はこの一連の処理を
終了する。一方、ユーザが「検索継続」キーを押下する
と、ステップS102に戻って、CPU1は再び大容量
記憶装置4内の検索用データを検索し(S102)、ス
テップS103以降の処理を繰り返す。
【0062】なお、呼び出された画像データを外部へ出
力するためのインターフェイスI/Fを備えて、パーソ
ナルコンピュータ、フロッピーディスク、光ディスク、
ファクシミリ装置などの外部機器にその画像データを出
力しても良い。
【0063】
【発明の効果】以上より明らかなように、請求項1の画
像処理装置は、紙面に表わされた文書を部分的に順次光
学的に読み取って画像データを得る画像入力手段と、上
記画像入力手段によって得られた各画像データがそれぞ
れ文字画像に相当するか否かを判断する第1の判定手段
と、上記第1の判定手段によって文字画像に相当すると
判断された画像データを順次蓄える画像メモリと、上記
画像メモリに蓄えられた画像データが検索用のワードを
作成するのに必要な一定量に達したか否かを判断する第
2の判定手段と、上記画像メモリに蓄えられた画像デー
タが上記一定量に達したと判断されたとき、上記一定量
に達した画像データを文字認識して上記符号化データを
得る文字認識手段を備えているので、文書を読み取って
得られた画像データに、この画像データを検索するため
のワードを表す符号化データを自動的に付加することが
できる。
【0064】請求項2に記載の画像処理装置によれば、
記憶装置に圧縮後の画像データが格納されるので、上記
記憶装置の容量が少なくて済み、画像データが効率良く
保存される。
【0065】請求項3に記載の画像処理装置によれば、
さらに画像データが効率良く保存される。
【0066】請求項4に記載の画像処理装置では、上記
第1の判定手段は、上記各画像データが文字画像に相当
するか否かを、上記画像圧縮手段による上記ライン毎の
画像データの圧縮率に基づいて判断するので、上記各画
像データが文字画像に相当するか否かが、上記ライン毎
に確実に判断される。
【0067】請求項5に記載の画像処理装置では、上記
画像メモリに蓄えられた画像データが上記一定量に達す
るまでに、上記第1の判定手段によって或る画像データ
が文字画像に相当しないと判断されたとき、制御手段に
よって、上記画像メモリに既に蓄えられている画像デー
タがクリアされるので、上記画像メモリに蓄えられる上
記一定量の画像データは、上記文書内の連続した文字部
分の画像データとなる。したがって、文字認識手段が出
力する検索用の符号化データとして、上記文書内の一定
量連続した文字部分を符号化したものを得ることかでき
る。
【0068】請求項6に記載の画像処理装置では、上記
画像入力手段によって文書1ページ分の読み取りが終了
する毎に、そのページの画像データに対応する符号化デ
ータを上記記憶装置に格納するとともに、上記画像メモ
リをクリアするので、文書の各ページの画像データに対
してそれぞれ一つの検索用の符号化データを付加でき
る。
【0069】請求項7に記載の画像処理装置では、上記
画像入力手段によって文書全ページの読み取りが終了し
たとき、その全ページの画像データに対応して一つの符
号化データを格納するので、文書の全ページの画像デー
タに対して一つの検索用の符号化データを付加できる。
【図面の簡単な説明】
【図1】 この発明の一実施形態の画像処理装置のブロ
ック構成を示す図である。
【図2】 上記画像処理装置によって、文書を読み取っ
て画像データを得るとともに、その画像データに検索用
データを付加するための第1の処理フローを示すずであ
る。
【図3】 上記第1の処理フローによって得られる検索
用データが、文書全体のどの部分に対応するかを示す図
である。
【図4】 上記画像処理装置によって、文書を読み取っ
て画像データを得るとともに、その画像データに検索用
データを付加するための第2の処理フローを示すずであ
る。
【図5】 上記第2の処理フローによって得られる検索
用データが、文書の各ページのどの部分に対応するかを
示す図である。
【図6】 上記画像処理装置によって、文書を読み取っ
て画像データを得るとともに、その画像データに検索用
データを付加するための第3の処理フローを示すずであ
る。
【図7】 上記第3の処理フローによって得られる検索
用データが、文書全体のどの部分に対応するかを示す図
である。
【図8】 上記画像処理装置によって、文書を読み取っ
て画像データを得るとともに、その画像データに検索用
データを付加するための第4の処理フローを示すずであ
る。
【図9】 上記第4の処理フローによって得られる検索
用データが、文書の各ページのどの部分に対応するかを
示す図である。
【図10】 上記画像処理装置によって、文書を読み取
って画像データを得るとともに、その画像データに検索
用データを付加するための第5の処理フローを示すずで
ある。
【図11】 上記第4の処理フローによって得られる検
索用データが、文書の各ページのどの部分に対応するか
を示す図である。
【図12】 大容量記憶装置に検索用データとともに格
納された画像データを呼び出す処理フローを示す図であ
る。
【図13】 画像データとこれに対応する検索用データ
が大容量記憶装置内に格納されている態様を示す図であ
る。
【符号の説明】
1 CPU 2 読み取り部 4 大容量記憶装置 5 操作パネル 6 画像メモリ C 文字行 P 写真部分
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5B029 AA01 BB02 BB06 BB17 CC28 CC29 DD10 EE08 EE18 5B075 ND07 ND18 ND23 NK13 NK24 NR03 NR16 PP10 PP12 PP22 PQ02 PQ03 5C073 AA03 AA06 AB03 AB12 BC04 BD03 CE01

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 文書を読み取って得られた画像データ
    と、この画像データを検索するためのワードを表す符号
    化データとを記憶装置に格納する処理を行う画像処理装
    置であって、 紙面に表わされた文書を部分的に順次光学的に読み取っ
    て画像データを得る画像入力手段と、 上記画像入力手段によって得られた各画像データがそれ
    ぞれ文字画像に相当するか否かを判断する第1の判定手
    段と、 上記第1の判定手段によって文字画像に相当すると判断
    された画像データを順次蓄える画像メモリと、 上記画像メモリに蓄えられた画像データが上記ワードを
    作成するのに必要な一定量に達したか否かを判断する第
    2の判定手段と、 上記画像メモリに蓄えられた画像データが上記一定量に
    達したと判断されたとき、上記一定量に達した画像デー
    タを文字認識して上記符号化データを得る文字認識手段
    を備えたことを特徴とする画像処理装置。
  2. 【請求項2】 請求項1に記載の画像処理装置におい
    て、 上記画像入力手段は、上記文書をライン状に順次読み取
    るラインセンサを含み、 上記画像入力手段によって得られたライン状の画像デー
    タを上記ライン毎に圧縮する画像圧縮手段を備え、 上記符号化データとともに上記画像圧縮手段による圧縮
    後の画像データを上記記憶装置に格納することを特徴と
    する画像処理装置。
  3. 【請求項3】 請求項2に記載の画像処理装置におい
    て、 上記画像入力手段は、文書の行方向と上記ラインセンサ
    の長手方向とを一致させた状態で、上記文書をライン状
    に順次読み取ることを特徴とする画像処理装置。
  4. 【請求項4】 請求項3に記載の画像処理装置におい
    て、 上記第1の判定手段は、上記各画像データが文字画像に
    相当するか否かを、上記画像圧縮手段による上記ライン
    毎の画像データの圧縮率に基づいて判断することを特徴
    とする画像処理装置。
  5. 【請求項5】 請求項1に記載の画像処理装置におい
    て、 上記画像メモリに蓄えられた画像データが上記一定量に
    達するまでに、上記第1の判定手段によって或る画像デ
    ータが文字画像に相当しないと判断されたとき、上記画
    像メモリに既に蓄えられている画像データをクリアする
    制御手段を備えたことを特徴とする画像処理装置。
  6. 【請求項6】 請求項1に記載の画像処理装置におい
    て、 上記画像入力手段によって文書1ページ分の読み取りが
    終了する毎に、そのページの画像データに対応する符号
    化データを上記記憶装置に格納するとともに、上記画像
    メモリをクリアする画像処理装置。
  7. 【請求項7】 請求項1に記載の画像処理装置におい
    て、 上記画像入力手段によって文書全ページの読み取りが終
    了したとき、その全ページの画像データに対応して一つ
    の符号化データを格納する画像処理装置。
JP10227965A 1998-08-12 1998-08-12 画像処理装置 Pending JP2000059588A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10227965A JP2000059588A (ja) 1998-08-12 1998-08-12 画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10227965A JP2000059588A (ja) 1998-08-12 1998-08-12 画像処理装置

Publications (1)

Publication Number Publication Date
JP2000059588A true JP2000059588A (ja) 2000-02-25

Family

ID=16869042

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10227965A Pending JP2000059588A (ja) 1998-08-12 1998-08-12 画像処理装置

Country Status (1)

Country Link
JP (1) JP2000059588A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011513849A (ja) * 2008-03-07 2011-04-28 ジェイエル ホールディングス エーピーエス スキャンの方法
JP2011513850A (ja) * 2008-03-07 2011-04-28 ジェイエル ホールディングス エーピーエス スキャンの方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011513849A (ja) * 2008-03-07 2011-04-28 ジェイエル ホールディングス エーピーエス スキャンの方法
JP2011513850A (ja) * 2008-03-07 2011-04-28 ジェイエル ホールディングス エーピーエス スキャンの方法

Similar Documents

Publication Publication Date Title
US7835037B2 (en) Image processing apparatus and image processing method
US7336378B2 (en) Image processing with recognized character codes
US20120250107A1 (en) Image processing apparatus, image processing method, and computer readable medium storing program
US8891109B2 (en) Printing device capable of displaying thumbnail image of image file
JP2000059588A (ja) 画像処理装置
JP2007201752A (ja) 画像入力プログラム、画像入力装置、画像入力システムおよび画像入力方法
KR20070013157A (ko) 이미지데이터의 저장방법
JP2007080099A (ja) 画像処理装置、画像検索方法および画像検索プログラム
JPH06236408A (ja) 電子ファイル装置
JP5086981B2 (ja) 画像形成装置
JP4637617B2 (ja) プレビュー画像表示プログラム及び画像表示装置
JP3142902B2 (ja) 画像記憶装置および画像検索方法
JP3424942B2 (ja) 対訳画像形成装置
JP6717147B2 (ja) 画像出力装置
JP2918579B2 (ja) 画像処理装置
JPS63107269A (ja) 画像処理システム
JPH01114261A (ja) 情報処理装置
JP2002077598A (ja) 画像処理装置、画像処理方法および画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2674887B2 (ja) ワードプロセッサ
JP2730073B2 (ja) 表題一覧作成装置
JP2003198856A (ja) 画像圧縮方法、その復元方法及びそのプログラム
JPH09231309A (ja) 電子ファイリング装置
JPS62251884A (ja) 記録装置
JPH0237471A (ja) 情報検索装置
JPH08335886A (ja) 情報出力装置

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20040423