JP3880240B2 - 画像処理装置及びその方法 - Google Patents

画像処理装置及びその方法 Download PDF

Info

Publication number
JP3880240B2
JP3880240B2 JP13306899A JP13306899A JP3880240B2 JP 3880240 B2 JP3880240 B2 JP 3880240B2 JP 13306899 A JP13306899 A JP 13306899A JP 13306899 A JP13306899 A JP 13306899A JP 3880240 B2 JP3880240 B2 JP 3880240B2
Authority
JP
Japan
Prior art keywords
image
partial
data
compressed
binary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP13306899A
Other languages
English (en)
Other versions
JP2000324343A (ja
JP2000324343A5 (ja
Inventor
和之 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP13306899A priority Critical patent/JP3880240B2/ja
Priority to US09/570,611 priority patent/US7426054B1/en
Publication of JP2000324343A publication Critical patent/JP2000324343A/ja
Application granted granted Critical
Publication of JP3880240B2 publication Critical patent/JP3880240B2/ja
Publication of JP2000324343A5 publication Critical patent/JP2000324343A5/ja
Priority to US12/198,498 priority patent/US7639388B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、文書画像を入力して保存し、それらを再生する画像処理装置及びその方法に関するものである。
【0002】
【従来の技術】
従来、文書画像を入力して処理する装置としては、例えば文書及び画像などが印刷された原稿を光学的に読み取って入力し、その原稿画像を印刷して出力する複写機や、その光学的に入力した原稿画像を保存する文書データベースシステムや、その原稿画像をネットワーク等を介して伝送するファクシミリ装置等があった。
【0003】
【発明が解決しようとする課題】
しかしながら、このような従来の装置では、デジタル化やネットワーク化に適応できなくなっている。具体的には、原稿画像のカラー化により、原稿画像をそのまま保存したり、ネットワークを介して配信したのでは、その画像データの量が膨大なものとなる。また、画像データの圧縮に際して、その原稿画像の画像データを一律に圧縮したのでは、再利用に適した画質を保つことができない。また、その原稿画像を出力する出力機器が、白黒プリンタやカラープリンタ等といった違いによって、その出力画像の画質が劣化してしまう等の課題があった。
【0004】
本発明は上記従来例に鑑みてなされたもので、入力した多値の文書画像のデータ量を削減して記憶し、それらを読み出して高品位に再生できる画像処理装置及びその方法を提供することを目的とする。
【0005】
【課題を解決するための手段】
上記目的を達成するために本発明の画像処理装置は以下のような構成を備える。即ち、 圧縮前の多値の文書画像を入力する画像入力手段と、
前記画像入力手段により入力された多値の文書画像から二値画像データを作成する二値画像作成手段と、
前記二値画像作成手段により作成された二値画像データに基づいて前記文書画像を属性毎の領域に分割し、当該分割された各領域の属性の情報とレイアウトの情報とを含むレイアウト解析データを生成するレイアウト解析手段と、
記文書画像を保存する際の保存レベルを設定する保存レベル設定手段と、
前記保存レベル設定手段によって第1の保存レベルが設定された場合、前記レイアウト解析データに基づいて、テキスト属性を有する領域の部分画像を前記二値画像データから切り出し、テキスト以外の属性を有する領域の部分画像を前記多値の文書画像から切り出し、当該切り出された部分画像のうち、二値の部分画像を二値画像用圧縮処理で圧縮し、多値の部分画像を多値画像用圧縮処理で圧縮し、当該圧縮された各部分画像を格納した文書画像理解データを保存し、
一方、前記保存レベル設定手段によって第2の保存レベルが設定された場合、前記多値の文書画像の全体画像を多値画像用圧縮処理で圧縮し、更に、前記レイアウト解析データに基づいて、テキスト属性を有する領域の部分画像を前記二値画像データから切り出し、当該切り出された二値の部分画像を二値画像用圧縮処理で圧縮し、当該圧縮されたテキスト属性の部分画像と前記圧縮された全体画像とを格納した文書画像理解データを保存し、
一方、前記保存レベル設定手段によって第3の保存レベルが設定された場合、前記多値の文書画像の全体画像を多値画像用圧縮処理で圧縮し、更に、前記レイアウト解析データに基づいて、テキスト属性を有する領域の部分画像を前記二値画像データから切り出し、テキスト以外の属性を有する領域の部分画像を前記多値の文書画像から切り出し、当該切り出された部分画像のうち、二値の部分画像を二値画像用圧縮処理で圧縮し、多値の部分画像を多値画像用圧縮処理で圧縮し、当該圧縮された各部分画像と前記圧縮された全体画像とを格納した文書画像理解データを保存する保存手段と、
を有することを特徴とする。
【0006】
上記目的を達成するために本発明の画像処理方法は以下のような工程を備える。即ち、 圧縮前の多値の文書画像を入力する画像入力工程と、
前記画像入力工程で入力された多値の文書画像から二値画像データを作成する二値画像作成工程と、
前記二値画像作成工程で作成された二値画像データに基づいて前記文書画像を属性毎の領域に分割し、当該分割された各領域の属性の情報とレイアウトの情報とを含むレイアウト解析データを生成するレイアウト解析工程と、
記文書画像を保存する際の保存レベルを設定する保存レベル設定工程と、
前記保存レベル設定工程で第1の保存レベルが設定された場合、前記レイアウト解析データに基づいて、テキスト属性を有する領域の部分画像を前記二値画像データから切り出し、テキスト以外の属性を有する領域の部分画像を前記多値の文書画像から切り出し、当該切り出された部分画像のうち、二値の部分画像を二値画像用圧縮処理で圧縮し、多値の部分画像を多値画像用圧縮処理で圧縮し、当該圧縮された各部分画像を格納した文書画像理解データを保存し、
一方、前記保存レベル設定工程で第2の保存レベルが設定された場合、前記多値の文書画像の全体画像を多値画像用圧縮処理で圧縮し、更に、前記レイアウト解析データに基づいて、テキスト属性を有する領域の部分画像を前記二値画像データから切り出し、当該切り出された二値の部分画像を二値画像用圧縮処理で圧縮し、当該圧縮されたテキスト属性の部分画像と前記圧縮された全体画像とを格納した文書画像理解データを保存し、
一方、前記保存レベル設定工程で第3の保存レベルが設定された場合、前記多値の文書画像の全体画像を多値画像用圧縮処理で圧縮し、更に、前記レイアウト解析データに基づいて、テキスト属性を有する領域の部分画像を前記二値画像データから切り出し、テキスト以外の属性を有する領域の部分画像を前記多値の文書画像から切り出し、当該切り出された部分画像のうち、二値の部分画像を二値画像用圧縮処理で圧縮し、多値の部分画像を多値画像用圧縮処理で圧縮し、当該圧縮された各部分画像と前記圧縮された全体画像とを格納した文書画像理解データを保存する保存工程と、
を有することを特徴とする。
【0007】
【発明の実施の形態】
以下、添付図面を参照して本発明の好適な実施の形態を詳細に説明する。
【0008】
図1は、本実施の形態1に係る画像処理システムの機能構成を示す機能ブロック図である。
【0009】
図1において、101は入力される文書で、印刷物やコンピュータ上で扱う画像データ等を含む文書原稿である。102は画像入力部で、例えばスキャナ等を有し、文書101を読み取って画像信号として入力する。103は画像入力部102から入力された原画像データである。104は二値画像出力部で、入力文書101の画像信号から二値画像データ105を作成して出力する。106はレイアウト解析部で、二値画像データ105を基に、その入力された文書画像を図やテキストや表等の各種属性に対応する領域に分割した情報、即ち、レイアウト解析データ107を出力する。108は保存レベル設定部で、入力された文書画像を解析して理解し、その情報、即ち、文書画像理解データ111を得るためのパラメータである保存レベルを設定する。109は文書画像理解保存部で、入力文書原画像103及び二値画像データ105から適応的に保存条件を変更しながら文書画像理解データを保存する。110は文書画像理解データ出力部で、文書画像理解保存部109に記憶されている文書画像理解データ111を読み出して出力する。112は文書画像理解データ入力部で、文書画像理解データ出力部110から出力される文書画像理解データ111を入力する。この文書画像理解データ出力部110と文書画像理解データ入力部は、後述するネットワーク212により接続されるものであっても良い。113は再生レベル設定部で、文書画像理解データ111をもとに、元の文書画像を再生処理するためのパラメータを設定する。114は文書画像理解再生部で、文書画像理解データ111から適応的に再生条件を変更しながら文書画像を作成する。115は再生される文書画像データ、116は再生文書画像115を出力する画像出力部、117は、最終的に再生されて出力される出力文書である。
【0010】
図2は、本実施の形態1に係る画像処理システムの構成を説明する概念図である。
【0011】
図2において、201は文書画像の理解処理を行うコンピュータで、図1の二値画像出力部104、レイアウト解析部106、保存レベル設定部108等に相当している。202はデータを保存する記憶装置で、図1の文書画像理解保存部109に該当している。203はスキャナで、原稿画像を読み取って光電的に画像を入力している。204はカラープリンタである。205はファクシミリ、206はカラー画像の入力及びプリント出力を複合的に行うデジタルカラー複写機である。207はプリンタ208を管理するプリンタサーバ、208はモノクロプリンタである。209はデータべ−スを管理するファイルサーバ、210はデータべ−ス、211はモノクロ画像の入力及びプリント出力を複合的に行うデジタル複写機である。212は上述した各デジタル機器同士を接続するネットワークであり、LANや公衆回線等により実現される。この構成において、画像入力部102は、スキャナ203や複写機206、211等のスキャナ部、更にはファクシミリ装置205の原稿読取り部にも相当している。また画像出力部116は、プリンタ204、208、及び複写機206,211のプリンタ部、更にはファクシミリ装置205のプリンタ部などが相当している。
【0012】
次に本実施の形態に係る画像処理システムにおける処理の流れについて説明する。
【0013】
図3は、本実施の形態に係る画像処理システムにおける処理の流れを説明するフローチャートである。
【0014】
本実施の形態では、24ビット多値画像をスキャナ203や複写機206などより入力し、ネットワーク212を介して配信し、その配信先でモノクロプリンタ208や複写機211或はファクシミリ装置205等で出力する場合で説明する。
【0015】
まずステップS301で、画像入力部102であるスキャナ203より文書画像を多値画像として入力する。次にステップS302に進み、その多値画像データを二値画像出力部104により二値画像データ105に変換する。そしてステップS303で、その二値画像データ105を基に、レイアウト解析部106により、その文書画像に含まれる図やテキストや表等を、各種属性毎に領域に分割し、レイアウト解析データ107(図4参照)を出力する。
【0016】
図4(a)(b)において、レイアウト解析データ107は、その分割された領域数nと、各領域ごとの始点のX,Y座標、幅、高さ、及びその属性(テキスト=1、線図形=2、絵・写真=3、表=4)が記憶されている。
【0017】
次にステップS304に進み、保存レベル設定部108において、保存レベルの設定を行う。本実施の形態1では、オペレータにより、この保存レベルを「レベル1」から「レベル3」までの内の何れかに設定できるものとする。ここでのオペレータによる保存レベルの設定は、図2に示したシステムのいずれかの端末におけるキーボード或はタッチパネルなどにより入力される。また一度入力したレベルを次に変更されるまで保存して、異なる入力画像に対して繰り返し用いてもよい。次にステップS305に進み、文書画像理解保存部109において、レイアウト解析データ107及び設定された保存レベルを基にして、入力文書の原画像である多値画像103及び二値画像データ105から適応的に保存条件を変更しながら文書画像理解データ111を作成して保存する。そしてステップS306に進み、その文書画像理解データ111を出力する。この時、ステップS304で設定され、ステップS305で処理された保存レベルを示すタグを文書画像理解データ111に付して出力する。
【0018】
以下、上記各処理の詳細を説明する。
【0019】
図5乃至図8は、図3のステップS305における設定された保存レベルに応じた文書画像の保存処理を示すフローチャートである。
【0020】
図5において、まずステップS501で、ステップS304で設定されている保存レベルを判定し、それぞれのレベルに応じた文書画像理解保存処理(S502,S503,S504のいずれか)に処理を分岐させる。
【0021】
ここで、判定された保存レベルが「レベル1」の場合にはステップS502に進み、図6のフローチャートで示すように処理される。
【0022】
まずステップS601で、各分割領域のレイアウト解析データ107を分析して、各領域の領域属性を求める。次にステップS602において、その領域属性が『テキスト』であればステップS603に進み、切り取り先の画像として二値画像データを選択し、ステップS605で、レイアウト解析データ107の領域の座標データ(X,Y)、幅、高さを用いて、その部分画像を切り取る。
【0023】
一方、ステップS602で、領域属性が『テキスト』でなかった場合(非『テキスト』領域)はステップS604に進み、切り取り先の全体画像として原画像である多値画像103を選択し、ステップS605で、レイアウト解析データ107の領域の座標データ、幅、高さ等を用いて、その部分画像を切り取る。
【0024】
次にステップS606に進み、その切り取った部分画像の画像タイプを調べ、二値画像であればステップS607に進み、二値画像用の圧縮処理を施し(例えばMMR等)、その圧縮した部分画像を、文書画像理解データ111(図9)として保存する(S609)。この時、文書画像理解データ111に、その圧縮方式を示すデータも記録しておくことにより、文書画像理解再生部114においてその圧縮画像を復号可能としている。
【0025】
またステップS606において調べた結果が多値画像であったならばステップS608に進み、多値画像用の圧縮処理を施し(例えばJPEG等)、その圧縮した部分画像を、文書画像理解データ(図9)として保存する(S609)。
【0026】
図9は、本実施の形態に係る文書画像理解データ111のデータ構成を説明する図である。
【0027】
図9において、部分画像データの場合、対象となったレイアウト領域のレイアウト解析データ107での出現順位をレイアウト領域データIDとし、切り取り幅、切り取り高さ、画像タイプ、圧縮方式、画像サイズおよび圧縮した切り取り画像を部分画像データとして保存する。
【0028】
図10(a)は、画像タイプの識別番号を、図10(b)は圧縮方式の識別番号を説明する図である。
【0029】
そして図6のステップS610に進み、残りの分割領域が存在しているか否かを調べ、存在していればステップS601に戻り、残りの分割領域について上記の処理を繰り返す。このステップS610で残りの分割領域が存在していなければ、文書画像理解保存処理を終了する。
【0030】
また、もし図5のステップS501で判定された保存レベルが「レベル2」の場合の保存処理を図7のフローチャートを参照して説明する。
【0031】
まずステップS701で、全体画像を全体画像データとして保存処理を行う。この時、本実施の形態では、全体画像はステップS301の多値画像入力処理によって入力されているので多値画像用の圧縮(例えばJPEG)を用いて保存する。この全体画像データの場合の文書画像理解データの詳細は、図9に示すように、幅、高さ、画像タイプ、圧縮方式、画像サイズ及び圧縮した画像を全体画像情報として保存する。
【0032】
次にステップS702で、各分割領域のレイアウト解析データ107を解析して、各領域の領域属性を求める。次にステップS703で、その領域属性が『テキスト』であればステップS704に進み、切り取り先全体画像として二値画像データ105を選択する。次にステップS705で、レイアウト解析データ107の領域の座標データ、幅、高さ等を用いて部分画像を切り取る。次にステップS706で、二値画像用の圧縮処理を施し(例えばMMR等)、その圧縮した部分画像を文書画像理解データ111(図9)として保存処理を行う。
【0033】
また、もしステップS703で、領域属性が『テキスト』でなかった場合はステップS707に進み、その分割領域についての部分画像の保存処理は行わない。こうしてステップS706の次、或はステップS703に続いてステップS707に進み、残りの分割領域が存在しているか否かを調べ、存在していればステップS702に戻り、残りの分割領域について上記の処理を繰り返す。また残りの分割領域が存在していなければ、文書画像理解データ111の保存処理を終了する。
【0034】
またステップS501で判定された保存レベルが「レベル3」の場合は、図8のフローチャートで示すように実行される。
【0035】
図8において、まずステップS801で、全体画像を全体画像データとして保存処理を行う。次にステップS802に進み、各分割領域のレイアウト解析データ107を分析して、各領域の領域属性を求める。次にステップS803に進み、領域属性が『テキスト』であればステップS804に進み、切り取り先全体画像として二値画像データ105を選択し、ステップS805ででレイアウト解析データ107の領域の座標データ、幅、高さを用いて部分画像を切り取る。
【0036】
またステップS803で、領域属性が『テキスト』でなかった場合はステップS806に進み、切り取り先全体画像として原画像である多値画像103を選択し、ステップS805でレイアウト解析データ107の領域の座標データ、高さ、幅を用いて部分画像を切り取る。
【0037】
次にステップS807に進み、その切り取った部分画像を調べ、二値画像であればステップS808に進み、二値画像用の圧縮処理を施し(例えばMMR等)、その圧縮した部分画像を文書画像理解データ(図9)として保存処理を行う(S809)。この時、文書画像理解データに、その圧縮方式も記録しておくことにより、文書画像理解再生処理においてその圧縮画像を復号可能とする。
【0038】
またステップS807において調べた結果が、多値画像であったならばステップS810に進み、多値画像用の圧縮処理を施し(例えばJPEG等)、その圧縮した部分画像を文書画像理解データ(図9)として保存処理を行う(S809)。こうしてステップS811に進み、残りの分割領域が存在しているか否かを調べ、存在していればステップS802に戻り、残りの分割領域について上記の処理を繰り返す。またステップS811で、残りの分割領域が存在していなければ、文書画像理解保存処理を終了する。
【0039】
更に本実施の形態では、文書画像理解保存部109において作成し、保存された文書画像理解データ111は、文書画像理解データ出力部110によりネットワーク212に出力され、このネットワーク212を介して利用先に配信される。
【0040】
これを受取った利用先では、図11のフローチャートで示す処理に従って再生画像を出力する。
【0041】
図11において、まずステップS401で、文書画像理解データ入力部112により文書画像理解データ111を入力し、次にステップS402で、再生レベル設定部113において、その文書画像の再生レベルの設定を行う。本実施の形態では、オペレータを介して「レベル1」から「レベル3」までの3つのパラメータの何れかを設定するものとする。ここでのオペレータによる再生レベルの設定の操作は、ステップS304と同様に、図2に示したシステムのいずれかの端末におけるキーボード或はタッチパネルなどの入力手段により、いずれかのレベルが選択されるが、再生レベルの設定の場合は、入力した文書画像理解データがいずれの保存レベルで保存されたデータであるかによって選択可能な再生レベルが限定されているため、文書画像理解データ111に付されているタグが示す保存レベルに応じて可能な再生レベルを判定して表示器に表示することにより、オペレータに提示してもよい。次にステップS403に進み、文書画像理解再生部114において、レイアウト解析データ107およびステップS402で設定された再生レベルを基にして、文書画像理解データ111から適応的に再生条件を変更しながら再生文書画像データ115を作成する。
【0042】
図12は、このステップS403における文書画像理解データ111に基づく画像再生処理を示すフローチャートである。
【0043】
図12において、まずステップS1001で、文書画像理解データ111に全体画像データが保存されているか否かを調べる。もし全体画像データが保存されていない場合にはステップS1003に進み、強制的に「レベル1」の文書画像理解データの再生処理を行う。もし全体画像データが保存されている場合はステップS1002に進み、ステップS402で設定された再生レベルを判定し、それぞれのレベルに応じた文書画像理解データの再生処理(S1003〜S1005のいずれか)に処理を分岐させる。
【0044】
図13は、再生レベルが「レベル1」の場合の処理(S1003)を示すフローチャートである。
【0045】
図13において、まずS1101で、再生文書画像の下地となる画像を白い下地となるように作成する。次にステップS1102に進み、文書画像理解データ111から部分画像データを取り出し、ステップS1103で、その取り出した部分画像とその座標データから白い下地画像と合成して再生画像を作成する。
【0046】
このステップS1103における再生合成処理の一例を図16のフローチャートで示す。
【0047】
図16において、まずステップS1401において、文書画像理解データ111から部分画像の画像タイプを抽出し、ステップS1402において、画像タイプが『二値画像タイプ』であればステップS1403に進み、二値画像の黒、白画素をそれぞれ24ビット多値画像の黒、白画素データに変換する疑似24ビット化の処理を行う。
【0048】
本実施の形態では、二値画像の黒画素は“1”、白画素は“0”、24ビット多値画像の黒画素は、R=0、G=0、B=0であり、白画素はR=255、G=255、B=255(Rは赤成分、Gは緑成分、Bは青成分で、各8ビットの値を持つ)としている。
【0049】
またステップS1402において、画像タイプが『24ビット多値画像タイプ』であれば、そのままの部分画像を合成に用いる。こうしてステップS1404に進み、下地画像と部分画像に対し部分画像の各画素の論理演算を行い合成画像を作成する。
【0050】
本実施の形態では、下地画像の白画素(R=255,G=255、B=255)と部分画像の黒画素(R=0,G=0,B=0)の合成画像が黒画素(R=0,G=0,B=0)となるように論理演算を用いている。
【0051】
以上のような処理によって、1つの部分画像データに対して再生合成処理(図13のS1103)を終了するとステップS1104に進み、残りの部分画像データが存在しているか否かを調べ、存在していればステップS1102に戻り、残りの部分画像データについて上記の処理を繰り返す。残りの部分画像データが存在していなければ、文書画像理解再生処理を終了する。
【0052】
そして再び図11のステップS404に進み、画像出力部116であるモノクロプリンタ208、211等により再生画像を出力する。
【0053】
また、図12のステップS1002で、判定された再生レベルが「レベル2」の場合はステップS1004に進み、図14のフローチャートで示す文書画像理解再生処理を実行する。
【0054】
ここでは前述の「再生レベル1」の場合と同様に、まずステップS1201において、再生文書画像の下地となる画像を白い下地となるように作成する。次にステップS1202に進み、文書画像理解データ111から部分画像データを取り出し、ステップS1203で、各分割領域のレイアウト解析データ107を分析して各領域の領域属性を求める。ここでもし、領域属性が『テキスト』であればステップS1205に進み、この取り出した部分画像データとその座標データから白い下地画像と合成して再生画像を作成する。また領域属性が『テキスト』でなければステップS1204に進み、その座標データを用いて、全体画像から画像を切り取り、部分画像として取り出す。そしてステップS1205で、その部分画像と白い下地画像と合成し再生画像を作成する。
【0055】
以上のような処理によって、1つの部分画像データに対してステップS1205の再生合成処理を終了したら、次にステップS1206において残りの部分画像データが存在しているか否かを調べ、存在していればステップS1202に戻り、残りの部分画像データについて上記の処理を繰り返す。残りの部分画像データが存在していなければ、文書画像理解データの再生処理を終了する。
【0056】
こうして図11のステップS404において、画像出力部116であるモノクロプリンタから再生画像を出力文書として出力する。
【0057】
また、図12のステップS1002で、判定された再生レベルが「レベル3」の場合はステップS1005に進み、図15のフローチャートで示す文書画像理解再生処理を実行する。
【0058】
図15において、まずステップS1301で、全体画像データを取り出し、全体画像を再生文書画像の下地として用いる。次にステップS1302に進み、文書画像理解データ111から部分画像データを取り出し、ステップS1303で、各分割領域のレイアウト解析データ107を分析して、各領域の領域属性を求める。ここでもし、領域属性が『テキスト』であればステップS1304に進み、その取り出した部分画像データとその座標データから下地画像と合成して再生画像を作成する。またもし、領域属性が『テキスト』でなければステップS1305に進み、その領域についての部分画像の合成処理は行わない。
【0059】
以上のような処理によって、1つの部分画像データに対して再生合成処理(S1304)を終了したら、ステップS1305おいて残りの部分画像データが存在しているか否かを調べ、存在していればステップS1302に戻り、残りの部分画像データについて上記の処理を繰り返す。一方、残りの部分画像データが存在していなければ、文書画像理解再生処理を終了する。
【0060】
こうして図11のステップS404において、画像出力部116であるモノクロプリンタから再生画像を出力文書として出力する。
【0061】
以上説明したように本実施の形態1によれば、入力した文書画像に含まれる画像の属性に応じて部分画像に分割し、その画像の属性に応じて保存し、かつ再生することにより、保存する文書画像のデータ量を削減でき、再生された画像の質を高品位に保つことができる。
【0062】
[実施の形態2]
次に本発明の実施の形態2について説明する。この実施の形態2では、前述の実施の形態1では、保存レベル設定処理(S304)や再生レベル設定処理(S402)操作者による設定処理に基づいて行っていたのに対し、この実施の形態2では、それを自動化したことを特徴としている。
【0063】
以下に、保存レベル設定処理の自動化の例における処理の流れについて、図17のフローチャートに従って説明する。
【0064】
本実施の形態2では、保存レベル設定処理(S304)に入ったら、まずステップS901で、各分割領域のレイアウト解析データ107を取り出し、次にステップS902において、非『テキスト』領域のサイズの検査を行う。
【0065】
本実施の形態2では、検査条件の一例として、領域サイズの高さ(h)が閾値(Th)より大きい場合、或は幅(w)が閾値(Tw)より大きい場合、或は、領域面積(s)が閾値(Ts)よりも大きい場合に、検査結果を「NG」とし、それ以外の場合を「OK」とする。ステップS902における検査結果が「OK」であればステップS903に進み、「保存レベル1」を設定する。一方、ステップS902で、検査結果が「NG」であればステップS904に進み、検査を実行する。このステップS904では、非『テキスト』領域の個数の検査を行う。
【0066】
このステップS904では、検査条件の一例として、非『テキスト』領域の個数(n)が閾値(Tn)よりも多い場合に検査結果を「NG」とし、それ以外の場合を「OK」とする。ここで検査結果が「OK」であればステップS903において「保存レベル1」を設定する。また検査結果が「NG」であればステップS905の検査を実行する。このステップS905では、『テキスト』領域と非『テキスト』領域の重複の度合いの検査を行う。
【0067】
このステップS905では、検査条件の一例として『テキスト』領域と非『テキスト』領域の重複面積の大きさ(d)が閾値(Td)よりも大きい場合に検査結果を「NG」とし、それ以外の場合を「OK」とする。ここで検査結果が「OK」であればステップS906に進み、「保存レベル2」を設定する。また検査結果が「NG」であればステップS907に進み、「保存レベル3」を設定して保存レベルの自動設定処理を終了する。
【0068】
なお、本発明は複数の機器(例えばホストコンピュータ、インタフェイス機器、リーダ、プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機、ファクシミリ装置など)に適用してもよい。
【0069】
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体(または記録媒体)を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行することによっても達成される。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれる。
【0070】
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれる。
【0071】
以上説明したように本実施の形態によれば、
(1)文書画像の保存時における、データ量の削減。
(2)文書画像の配信時における、ネットワークトラフィックへの負荷軽減。
(3)文書画像の保存、配信時における、再利用に適した高画質の維持。
(4)出力時の文書画像の画質劣化や情報欠落の防止。
(5)DTP(デスクトップパブリッシング)等の電子文書への再利用の容易化等が図れるという効果がある。
【0072】
【発明の効果】
以上説明したように本発明によれば、入力した多値の文書画像のデータ量を削減して記憶し、それらを読み出して高品位に再生できるという効果がある。
【図面の簡単な説明】
【図1】本発明の実施の形態に係る画像処理システムの機能構成を示す機能ブロック図である。
【図2】本実施の形態に係る画像処理システムの構成を示す概念図である。
【図3】本実施の形態に係る画像処理システムにおける画像入力から文書画像理解データ出力までの処理を示すフローチャートである。
【図4】本実施の形態に係るレイアウト解析データの構成を説明する図である。
【図5】本実施の形態に係る文書画像理解保存処理を示すフローチャートである。
【図6】本実施の形態における保存レベル1での文書画像理解保存処理を示すフローチャートである。
【図7】本実施の形態における保存レベル2での文書画像理解保存処理を示すフローチャートである。
【図8】本実施の形態における保存レベル3での文書画像理解保存処理を示すフローチャートである。
【図9】本実施の形態に係る文書画像理解データの構成を説明する図である。
【図10】文書画像データの画像タイプと圧縮方式の識別番号を説明する図である。
【図11】本実施の形態に係る文書画像理解データの入力から再生画像の出力までの処理を示すフローチャートである。
【図12】本実施の形態に係る文書画像理解再生処理を示すフローチャートである。
【図13】本実施の形態に係る再生レベル1での文書画像理解再生処理を示すフローチャートである。
【図14】本実施の形態に係る再生レベル2での文書画像理解再生処理を示すフローチャートである。
【図15】本実施の形態に係る再生レベル3での文書画像理解再生処理を示すフローチャートである。
【図16】本実施の形態に係る図13のS1103の再生画像合成処理を示すフローチャートである。
【図17】本発明の実施の形態2に係る保存レベルの自動設定処理を示すフローチャートである。

Claims (11)

  1. 圧縮前の多値の文書画像を入力する画像入力手段と、
    前記画像入力手段により入力された多値の文書画像から二値画像データを作成する二値画像作成手段と、
    前記二値画像作成手段により作成された二値画像データに基づいて前記文書画像を属性毎の領域に分割し、当該分割された各領域の属性の情報とレイアウトの情報とを含むレイアウト解析データを生成するレイアウト解析手段と、
    記文書画像を保存する際の保存レベルを設定する保存レベル設定手段と、
    前記保存レベル設定手段によって第1の保存レベルが設定された場合、前記レイアウト解析データに基づいて、テキスト属性を有する領域の部分画像を前記二値画像データから切り出し、テキスト以外の属性を有する領域の部分画像を前記多値の文書画像から切り出し、当該切り出された部分画像のうち、二値の部分画像を二値画像用圧縮処理で圧縮し、多値の部分画像を多値画像用圧縮処理で圧縮し、当該圧縮された各部分画像を格納した文書画像理解データを保存し、
    一方、前記保存レベル設定手段によって第2の保存レベルが設定された場合、前記多値の文書画像の全体画像を多値画像用圧縮処理で圧縮し、更に、前記レイアウト解析データに基づいて、テキスト属性を有する領域の部分画像を前記二値画像データから切り出し、当該切り出された二値の部分画像を二値画像用圧縮処理で圧縮し、当該圧縮されたテキスト属性の部分画像と前記圧縮された全体画像とを格納した文書画像理解データを保存し、
    一方、前記保存レベル設定手段によって第3の保存レベルが設定された場合、前記多値の文書画像の全体画像を多値画像用圧縮処理で圧縮し、更に、前記レイアウト解析データに基づいて、テキスト属性を有する領域の部分画像を前記二値画像データから切り出し、テキスト以外の属性を有する領域の部分画像を前記多値の文書画像から切り出し、当該切り出された部分画像のうち、二値の部分画像を二値画像用圧縮処理で圧縮し、多値の部分画像を多値画像用圧縮処理で圧縮し、当該圧縮された各部分画像と前記圧縮された全体画像とを格納した文書画像理解データを保存する保存手段と、
    を有することを特徴とする画像処理装置。
  2. 前記文書画像理解データに格納されている全ての部分画像を取り出して白地の下地に合成することにより再生画像を作成する第1の再生レベルと、前記文書画像理解データに格納されているテキスト属性の部分画像を取り出し、更に、前記文書画像理解データに格納されている全体画像からテキスト以外の属性の領域に対応する部分を部分画像として切り出して、当該取り出したテキスト属性の部分画像と当該切り出したテキスト以外の属性の部分画像とを白地の下地に合成することにより再生画像を作成する第2の再生レベルと、前記文書画像理解データに格納されているテキスト属性の部分画像を取り出して、前記文書画像理解データに格納されている全体画像を下地として当該取り出したテキスト属性の部分画像を合成することにより再生画像を作成する第3の再生レベルと、の中からオペレータにより指定された再生レベルを設定する再生レベル設定手段と、
    前記再生レベル設定手段によって設定された再生レベルに基づいて、入力された再生対象の前記文書画像理解データから前記再生画像を作成することにより、前記文書画像を再生する文書画像再生手段と、を更に有し、
    前記再生対象の文書画像理解データが前記第1の保存レベルであって前記全体画像が格納されていない場合、前記文書画像再生手段では、前記再生レベル設定手段で設定された再生レベルを前記第1の再生レベルに設定変更してから再生することを特徴とする請求項1に記載の画像処理装置。
  3. 前記文書画像理解データに前記部分画像を格納する場合、前記文書画像理解データは、当該格納される部分領域の圧縮方式に関する情報を含むことを特徴とする請求項1に記載の画像処理装置。
  4. 前記保存レベル設定手段は、オペレータの指示に基づいて設定することを特徴とする請求項1に記載の画像処理装置。
  5. 前記保存レベル設定手段は、前記レイアウト解析データに基づいて自動設定することを特徴とする請求項に記載の画像処理装置。
  6. 圧縮前の多値の文書画像を入力する画像入力工程と、
    前記画像入力工程で入力された多値の文書画像から二値画像データを作成する二値画像作成工程と、
    前記二値画像作成工程で作成された二値画像データに基づいて前記文書画像を属性毎の領域に分割し、当該分割された各領域の属性の情報とレイアウトの情報とを含むレイアウト解析データを生成するレイアウト解析工程と、
    記文書画像を保存する際の保存レベルを設定する保存レベル設定工程と、
    前記保存レベル設定工程で第1の保存レベルが設定された場合、前記レイアウト解析データに基づいて、テキスト属性を有する領域の部分画像を前記二値画像データから切り出し、テキスト以外の属性を有する領域の部分画像を前記多値の文書画像から切り出し、当該切り出された部分画像のうち、二値の部分画像を二値画像用圧縮処理で圧縮し、多値の部分画像を多値画像用圧縮処理で圧縮し、当該圧縮された各部分画像を格納した文書画像理解データを保存し、
    一方、前記保存レベル設定工程で第2の保存レベルが設定された場合、前記多値の文書画像の全体画像を多値画像用圧縮処理で圧縮し、更に、前記レイアウト解析データに基づいて、テキスト属性を有する領域の部分画像を前記二値画像データから切り出し、当該切り出された二値の部分画像を二値画像用圧縮処理で圧縮し、当該圧縮されたテキスト属性の部分画像と前記圧縮された全体画像とを格納した文書画像理解データを保存し、
    一方、前記保存レベル設定工程で第3の保存レベルが設定された場合、前記多値の文書画像の全体画像を多値画像用圧縮処理で圧縮し、更に、前記レイアウト解析データに基づいて、テキスト属性を有する領域の部分画像を前記二値画像データから切り出し、テキスト以外の属性を有する領域の部分画像を前記多値の文書画像から切り出し、当該切り出された部分画像のうち、二値の部分画像を二値画像用圧縮処理で圧縮し、多値の部分画像を多値画像用圧縮処理で圧縮し、当該圧縮された各部分画像と前記圧縮された全体画像とを格納した文書画像理解データを保存する保存工程と、
    を有することを特徴とする画像処理方法。
  7. 前記文書画像理解データに格納されている全ての部分画像を取り出して白地の下地に合成することにより再生画像を作成する第1の再生レベルと、前記文書画像理解データに格納されているテキスト属性の部分画像を取り出し、更に、前記文書画像理解データに格納されている全体画像からテキスト以外の属性の領域に対応する部分を部分画像として切り出して、当該取り出したテキスト属性の部分画像と当該切り出したテキスト以外の属性の部分画像とを白地の下地に合成することにより再生画像を作成する第2の再生レベルと、前記文書画像理解データに格納されているテキスト属性の部分画像を取り出して、前記文書画像理解データに格納されている全体画像を下地として当該取り出したテキスト属性の部分画像を合成することにより再生画像を作成する第3の再生レベルと、の中からオペレータにより指定された再生レベルを設定する再生レベル設定工程と、
    前記再生レベル設定工程で設定された再生レベルに基づいて、入力された再生対象の前記文書画像理解データから前記再生画像を作成することにより、前記文書画像を再生する文書画像再生工程と、を更に有し、
    前記再生対象の文書画像理解データが前記第1の保存レベルであって前記全体画像が格納されていない場合、前記文書画像再生工程では、前記再生レベル設定工程で設定された再生レベルを前記第1の再生レベルに設定変更してから再生する
    ことを特徴とする請求項6に記載の画像処理方法。
  8. 前記文書画像理解データに前記部分画像を格納する場合、前記文書画像理解データは、当該格納される部分領域の圧縮方式に関する情報を含むことを特徴とする請求項6に記載の画像処理方法。
  9. 前記保存レベル設定工程では、オペレータの指示に基づいて設定することを特徴とする請求項6に記載の画像処理方法。
  10. 前記保存レベル設定工程では、前記レイアウト解析データに基づいて自動設定することを特徴とする請求項に記載の画像処理方法。
  11. 圧縮前の多値の文書画像を入力して圧縮保存するプログラムを記憶したコンピュータにより読取り可能な記憶媒体であって、
    圧縮前の多値の文書画像を入力する画像入力工程モジュールと、
    前記画像入力工程モジュールで入力された多値の文書画像から二値画像データを作成する二値画像作成工程モジュールと、
    前記二値画像作成工程モジュールで作成された二値画像データに基づいて、前記文書画像を属性毎の領域に分割し、当該分割された各領域の属性の情報とレイアウトの情報とを含むレイアウト解析データを生成するレイアウト解析工程モジュールと、
    記文書画像を保存する際の保存レベルを設定する保存レベル設定工程モジュールと、
    前記保存レベル設定工程モジュールで第1の保存レベルが設定された場合、前記レイアウト解析データに基づいて、テキスト属性を有する領域の部分画像を前記二値画像データから切り出し、テキスト以外の属性を有する領域の部分画像を前記多値の文書画像から切り出し、当該切り出された部分画像のうち、二値の部分画像を二値画像用圧縮処理で圧縮し、多値の部分画像を多値画像用圧縮処理で圧縮し、当該圧縮された各部分画像を格納した文書画像理解データを保存し、
    一方、前記保存レベル設定工程モジュールで第2の保存レベルが設定された場合、前記多値の文書画像の全体画像を多値画像用圧縮処理で圧縮し、更に、前記レイアウト解析データに基づいて、テキスト属性を有する領域の部分画像を前記二値画像データから切り出し、当該切り出された二値の部分画像を二値画像用圧縮処理で圧縮し、当該圧縮されたテキスト属性の部分画像と前記圧縮された全体画像とを格納した文書画像理解データを保存し、
    一方、前記保存レベル設定工程モジュールで第3の保存レベルが設定された場合、前記多値の文書画像の全体画像を多値画像用圧縮処理で圧縮し、更に、前記レイアウト解析データに基づいて、テキスト属性を有する領域の部分画像を前記二値画像データから切り出し、テキスト以外の属性を有する領域の部分画像を前記多値の文書画像から切り出し、当該切り出された部分画像のうち、二値の部分画像を二値画像用圧縮処理で圧縮し、多値の部分画像を多値画像用圧縮処理で圧縮し、当該圧縮された各部分画像と前記圧縮された全体画像とを格納した文書画像理解データを保存する保存工程モジュールと、
    を有することを特徴とするプログラムを記憶した、コンピュータにより読取り可能な記憶媒体。
JP13306899A 1999-05-13 1999-05-13 画像処理装置及びその方法 Expired - Fee Related JP3880240B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP13306899A JP3880240B2 (ja) 1999-05-13 1999-05-13 画像処理装置及びその方法
US09/570,611 US7426054B1 (en) 1999-05-13 2000-05-12 Image processing apparatus, image reproduction apparatus, system, method and storage medium for image processing and image reproduction
US12/198,498 US7639388B2 (en) 1999-05-13 2008-08-26 Image processing apparatus, image reproduction apparatus, system, method and storage medium for image processing and image reproduction

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP13306899A JP3880240B2 (ja) 1999-05-13 1999-05-13 画像処理装置及びその方法

Publications (3)

Publication Number Publication Date
JP2000324343A JP2000324343A (ja) 2000-11-24
JP3880240B2 true JP3880240B2 (ja) 2007-02-14
JP2000324343A5 JP2000324343A5 (ja) 2007-04-12

Family

ID=15096098

Family Applications (1)

Application Number Title Priority Date Filing Date
JP13306899A Expired - Fee Related JP3880240B2 (ja) 1999-05-13 1999-05-13 画像処理装置及びその方法

Country Status (1)

Country Link
JP (1) JP3880240B2 (ja)

Also Published As

Publication number Publication date
JP2000324343A (ja) 2000-11-24

Similar Documents

Publication Publication Date Title
JP5302768B2 (ja) 画像処理装置及び画像処理方法
CN102077178B (zh) 信息处理装置、其控制方法以及存储介质
JP5047051B2 (ja) 画像処理装置及び画像符号化方法
US7532757B2 (en) Image processing apparatus, control method therefor, and program
US8515062B2 (en) Image encryption/decryption apparatus, method and program
CN101520901B (zh) 图像处理装置和图像处理方法
US7639388B2 (en) Image processing apparatus, image reproduction apparatus, system, method and storage medium for image processing and image reproduction
JP5036430B2 (ja) 画像処理装置及びその制御方法
CN100505821C (zh) 图像处理设备和其控制方法
JP2006262078A (ja) 画像処理装置
US8218911B2 (en) Image processing apparatus and image processing method
JP2006025129A (ja) 画像処理システム及び画像処理方法
JP5153277B2 (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
JP2006023944A (ja) 画像処理システム及び画像処理方法
CN107241526A (zh) 图像处理装置和图像处理方法
JP2007221340A (ja) 画像ファイル生成方法及び画像ファイル生成装置
JPH08331362A (ja) 画像形成装置
JP5264155B2 (ja) プログラム、ファイル管理装置及びファイル管理方法
JP3880240B2 (ja) 画像処理装置及びその方法
JP4109793B2 (ja) 画像処理装置及びその方法
CN101267490B (zh) 图像处理设备和图像处理方法
JP2007005907A (ja) 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体
JP2000332984A (ja) 画像処理装置及び画像再生装置及びシステム及び方法及び記憶媒体
JP2003219187A (ja) 画像処理方法及び画像処理装置
JP2003348361A (ja) 画像処理装置

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060515

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060515

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20060515

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060710

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060908

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061010

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061107

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101117

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101117

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111117

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121117

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131117

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees