JP2002369011A - 画像処理装置、画像処理方法及び画像処理プログラム - Google Patents

画像処理装置、画像処理方法及び画像処理プログラム

Info

Publication number
JP2002369011A
JP2002369011A JP2001171377A JP2001171377A JP2002369011A JP 2002369011 A JP2002369011 A JP 2002369011A JP 2001171377 A JP2001171377 A JP 2001171377A JP 2001171377 A JP2001171377 A JP 2001171377A JP 2002369011 A JP2002369011 A JP 2002369011A
Authority
JP
Japan
Prior art keywords
image
character
data
unit
character area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001171377A
Other languages
English (en)
Inventor
Tsutomu Sakagami
努 坂上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2001171377A priority Critical patent/JP2002369011A/ja
Publication of JP2002369011A publication Critical patent/JP2002369011A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 文字が含まれた画像を高品質かつ高効率で圧
縮可能なファイリングシステムを作成する。 【解決手段】文字領域検出部104で、原画像から文字
領域と、原画像内における文字領域の座標を検出する。
文字部補間部105で、原画像から文字領域の画像を除
去し、除去された部分を周囲の画像でもって補間し補間
画像Aを作成する。縮小化部106で補間画像Aを縮小
し、JPEG圧縮部で情報圧縮して圧縮コードXを作成
する。一方で、文字抽出部108では、文字領域の文字
画像を抽出して、MMR部110で情報圧縮し圧縮コー
ドYを作成する。以上から得られた圧縮コードX、圧縮
コードY及び文字領域座標を含む保存ファイル114を
作成する。伸長の際には、保存ファイルを読み出して、
圧縮コードX、Yを伸長し、文字領域座標に基づいて原
画像を合成する。なお、複数の原画像がある場合は、各
画像のキーワードを含めたインデクス作成すると検索等
に便利である。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本願発明は、画像処理装置及
び画像処理方法に係り、とりわけ、文字画像の含まれた
多値画像を圧縮してファイリングする技術に関するもの
である。
【0002】
【従来の技術】近年、スキャナの普及により、文書の電
子化が進んでいる。文書を電子化することの主なメリッ
トは、文書の保存スペースを省略できること、所定の文
書を検索する時間を短縮できることにある。
【0003】このようにメリットのある文書の電子化で
はあるが、一方で、電子化された文書ファイルをフルカ
ラーで保持しようとするとメモリを著しく逼迫すること
になる。たとえば、A4サイズの画像を300 dot
per inch (以下、dpiと呼ぶ。)の解像度で
保持すると、画像のファイルサイズは、約24 Meg
abyte(以下、MBと呼ぶ。)の容量になってしま
う。また、電子化された文書ファイルを電子メールなど
に添付したくても、容量が大き過ぎて添付することがで
きない。そのため、画像を効率よく圧縮する技術が望ま
れる。
【0004】従来、画像圧縮方法として、Joint
Photographic Experts Group
Format (以下、JPEGと呼ぶ。)が広く知ら
れ、頻繁に用いられている。JPEGは、写真などの自
然画像を圧縮するには非常に効果も高く、画質も良いこ
とが知られている。
【0005】
【発明が解決しようとする課題】しかし、文字部などの
高周波部分をJPEGにて圧縮すると、モスキートノイ
ズと呼ばれる画像劣化が発生してまう。さらに、圧縮率
も低く、十分に画像ファイルのサイズを小さくすること
ができない。一方で、多くの画像データをファイリング
するためには圧縮率を優先する必要があるが、圧縮率を
優先すれば画像品位が劣化してしまうという課題があっ
た。
【0006】そこで、本願発明は、文字や写真等が混在
した文書データであっても効率よく圧縮することの可能
な画像処理装置等の提供を目的とする。
【0007】さらに、本願発明では、文字の色が一般的
な黒ではなく、他の色であったり、複数の色からなる場
合であっても、効率良く、しかも原画像に対して忠実に
圧縮することの可能な画像処理装置等の提供を目的とす
る。
【0008】また、本願発明では、本願発明の画像圧縮
方法で圧縮された文書データを伸長することの可能な画
像処理装置の提供を目的とする。
【0009】さらに、本願発明では、上述の画像処理装
置を応用し、複数の原画像をファイリングする画像処理
システムの提供を目的とする。
【0010】また、本願発明では、複数の原画像を管理
する際に役立つインデクスを作成する画像処理システム
の提供を目的とする。
【0011】
【課題を解決するための手段】上記目的を達成するた
め、本願発明は、原画像から文字領域と、該原画像内に
おける該文字領域の位置を検出する検出手段と、前記原
画像から前記文字領域の存在を低減して低減画像を生成
する低減手段と、前記低減画像を情報圧縮し、第1の圧
縮データを作成する第1の圧縮手段と、前記検出手段に
より検出された前記文字領域の画像を情報圧縮し、第2
の圧縮データを作成する第2の圧縮手段と、前記第1の
圧縮データ、前記第2の圧縮データ及び前記文字領域の
位置に関する情報を含む保存データを作成する作成手段
とを備えることを特徴とする画像処理装置を提供する。
【0012】ここで、前記低減手段は、前記原画像から
前記文字領域を除去する除去手段と、前記除去手段によ
り除去された領域に対して補間処理を施す補間手段とを
備えるように構成してもよい。
【0013】また、前記第1の圧縮手段は多値画像を圧
縮する手段であり、前記第2の圧縮手段は二値画像を圧
縮する手段とすれば、圧縮の効率化が達成できると思わ
れる。
【0014】また、前記画像処理装置は、前記文字領域
の画像を減色し減色画像を生成する減色手段をさらに備
え、前記第2の圧縮手段は、前記減色画像を情報圧縮
し、第2の圧縮データを作成するようにしてもよい。こ
のように構成すれば、多色文字であって効率よく圧縮で
きよう。
【0015】また、前記画像処理装置は、前記減色画像
が二値画像であるか否かを判定する判定手段とをさらに
備え、前記第2の圧縮手段は、前記判定手段により前記
減色画像が二値画像であると判定された場合には第1の
情報圧縮手法を用いて該減色画像を圧縮し、前記減色画
像が二値画像ではないと判定された場合には第2の情報
圧縮手法を用いて該減色画像を圧縮するように構成して
もよい。このように構成することで、単純な黒文字に対
してはMR、MHやMMR等の二値画像用の符号化を適
用し、他の色の文字や複数の色からなる文字に対して
は、減色してから圧縮を施すことで、複雑な配色の文字
に対しても効率よく圧縮が可能である。
【0016】また、前記文字領域の画像の代表色を抽出
する色抽出手段をさらに備え、前記作成手段は、前記抽
出手段により抽出された前記代表色に関するデータを含
めて前記保存データを作成するように構成すれば、伸長
時に代表色でもって文字画像を形成することができるた
め、より原画像に忠実な伸長を行うことができよう。
【0017】さらに、複数の前記保存データを記憶する
記憶手段と、前記記憶手段に記憶された複数の前記保存
データを読出し、複数の前記保存データに関するインデ
クスを作成するインデクス作成手段と、前記インデクス
作成手段により作成された前記インデクスを出力する出
力手段とを備えるように構成すれば、ファイリングシス
テムとして本願の画像処理装置は有効である。特にイン
デクスを作成することで、検索等を効率よく行うことが
できる。
【0018】前記インデクス作成手段は、前記保存デー
タに含まれる前記第2の圧縮データに対して文字認識処
理を実行する文字認識手段を備え、前記文字認識手段に
より文字認識された文字列を含むインデクスを作成する
ように構成すれば、文字検索を行うことができるため、
より高速に画像を検索できよう。
【0019】なお、文字認識手段に代えて、文字列を入
力するための文字列入力手段をさらに備え、前記インデ
クス作成手段は、前記文字列入力手段から入力された文
字列を含むインデクスを作成するように構成してもよ
い。この場合は、検索に役立つような画像のキーワード
等をキー入力等により行うことができ、ユーザの意思を
より反映させることができ、検索のスピードも高速にな
ろう。
【0020】また、前記インデクス作成手段は、インデ
クスのレイアウトを選択する選択手段と、前記保存デー
タに含まれる第1の圧縮データを伸長して伸長画像を作
成し、前記選択手段により選択されたレイアウトに基づ
いて、前記伸長画像のサイズを調整するサイズ調整手段
とをさらに備えるように構成してもよい。このように構
成すれば、複数の画像を一度に見ることが可能となり、
効率よく画像を閲覧できよう。
【0021】さらに、本願発明は、上述の課題を解決す
べく、原画像に含まれる文字領域を除外してなる残余の
画像を情報圧縮して生成された第1の圧縮データと、該
文字領域の画像を情報圧縮して生成された第2の圧縮デ
ータと、該原画像内における該文字領域の位置に関する
位置データとを含む保存データを記憶する記憶手段と、
前記記憶手段から前記保存データを読み出して、該読み
出された保存データに含まれる前記第1の圧縮データに
基づいて前記残余の画像を伸長する第1の伸長手段と、
前記記憶手段から前記保存データを読み出して、該読み
出された保存データに含まれる前記第2の圧縮データに
基づいて前記文字領域の画像を伸長する第2の伸長手段
と、前記記憶手段から前記保存データを読み出して前記
位置データを取得し、該位置データに基づいて前記文字
領域の画像と前記残余の画像とを合成する合成手段と、
前記合成手段により合成されてなる合成画像を出力する
出力手段と、を備えることを特徴とする画像処理装置を
提供する。
【0022】ここで、前記第1の伸長手段は、前記第1
の圧縮データを多値伸長し、前記第2の伸長手段は、前
記第2の圧縮データを二値伸長するように構成してもよ
い。
【0023】また、前記保存データには、さらに、前記
第2の圧縮データに関するパレット情報が含まれてお
り、前記合成手段は、前記パレット情報に基づいて前記
文字領域の画像にパレットを当てはめ、前記合成画像を
作成するように構成してもよい。
【0024】また、複数の前記合成画像に関するインデ
クスを作成するインデクス作成手段をさらに備え、前記
出力手段は、前記インデクス作成手段により作成された
前記インデクスを出力するように構成してもよい。
【0025】また、前記インデクス作成手段は、前記文
字領域の画像に対して文字認識処理を実行する文字認識
手段を備え、前記文字認識手段により文字認識された文
字列を含むインデクスを作成するようにしてもよい。
【0026】また、文字列を入力するための文字列入力
手段をさらに備え、前記インデクス作成手段は、前記文
字列入力手段から入力された文字列を含むインデクスを
作成するようにしてもよい。
【0027】また、前記インデクス作成手段は、インデ
クスのレイアウトを選択する選択手段と、前記選択手段
により選択されたレイアウトに基づいて、前記合成画像
のサイズを調整するサイズ調整手段とをさらに備えるよ
うにしてもよい。
【0028】また、本願発明は上記課題を解決すべく、
ネットワークを介して接続された第1の画像処理装置と
第2の画像処理装置とを備える画像処理システムであっ
て、前記第1の画像処理装置は、原画像から文字領域
と、該原画像内における該文字領域の位置を検出する検
出手段と、前記原画像における前記文字領域の画像の存
在を低減して低減画像を生成する低減手段と、前記低減
手段により生成された前記低減画像を情報圧縮し、第1
の圧縮データを作成する第1の圧縮手段と、前記検出手
段により検出された前記文字領域の画像を情報圧縮し、
第2の圧縮データを作成する第2の圧縮手段と、前記第
1の圧縮データ、前記第2の圧縮データ及び前記文字領
域の位置に関する情報を含む保存データを作成する作成
手段と、前記作成手段により作成された前記保存データ
を前記ネットワークを介して前記第2のが像処理装置に
送信する送信手段とを備え、前記第2の画像処理装置
は、前記送信手段から送信される前記保存データを受信
する受信手段と、前記受信手段により受信された前記保
存データに含まれる前記第1の圧縮データに基づいて前
記低減画像を伸長する第1の伸長手段と、前記保存デー
タに含まれる前記第2の圧縮データに基づいて前記文字
領域の画像を伸長する第2の伸長手段と、前記保存デー
タに含まれる前記位置データを取得し、該位置データに
基づいて前記文字領域の画像と前記低減画像とを合成す
る合成手段と、前記合成手段により合成されてなる合成
画像を出力する出力手段とを備えることを特徴とする画
像処理システムを提供する。
【0029】ここで、複数の前記合成画像に関するイン
デクスを作成するインデクス作成手段をさらに備え、前
記出力手段は、前記インデクス作成手段により作成され
た前記インデクスを出力するようにしてもよい。。
【0030】また、本願発明は、上記課題を解決すべ
く、原画像から文字領域と、該原画像内における該文字
領域の位置を検出するステップと、前記原画像における
前記文字領域の画像の存在を低減するステップと、前記
文字領域の画像の存在を低減された前記原画像を情報圧
縮し、第1の圧縮データを作成するステップと、検出さ
れた前記文字領域の画像を情報圧縮し、第2の圧縮デー
タを作成するステップと、前記第1の圧縮データ、前記
第2の圧縮データ及び前記文字領域の位置に関する情報
を含む保存データを作成するステップとを備えることを
特徴とする画像処理方法を提供する。
【0031】また、本願発明は、上記課題を解決すべ
く、原画像に含まれる文字領域を除外してなる残余の画
像を情報圧縮して生成された第1の圧縮データと、該文
字領域の画像を情報圧縮して生成された第2の圧縮デー
タと、該原画像内における該文字領域の位置に関する位
置データとを含む保存データを取得するステップと、前
記保存データに含まれる前記第1の圧縮データに基づい
て前記残余の画像を伸長するステップと、前記保存デー
タに含まれる前記第2の圧縮データに基づいて前記文字
領域の画像を伸長するステップと、前記保存データに含
まれる前記位置データに基づいて前記文字領域の画像と
前記残余の画像とを合成するステップと、前記合成画像
を出力するステップとを備えることを特徴とする画像処
理方法を提供する。
【0032】
【発明の実施の形態】本願発明によれば、次のような画
像の特性に着目することで、品質良く、しかも効率も良
く画像を圧縮するものである。一般に、人間の目の特性
によれば、低周波部分(主に自然画領域)は解像度をそ
れほど必要としないが階調が必要となり、一方で、高周
波部分(主に文字領域)は解像度が必要であるが階調を
それほど必要としない。そこで、この特性を利用して、
文字部以外の下地画像は解像度を落すことにより、例え
ば、200分の1程度の圧縮率が達成可能である。これ
は、24MBが120KBになることを意味する。その
ため本願発明をファイリングシステムに採用すれば、画
像品位を維持しつつ、多くの画像データをファイリング
して保存することが可能となる。
【0033】[第1の実施形態]以下、本願発明の第1の
実施形態を図面を用いて説明する。図1に本実施形態の
構成図を示す。図1において、101は原画像である。
102は原画像を入力し、画像の最適二値化を行う画像
二値化部である。103は画像二値化部により二値化さ
れた全面二値化画像である。104は全面二値化画像1
03を入力して文字領域を検出し、文字領域座標111
を生成する文字領域検出部である。105は文字領域座
標111と二値画像103を参照し、文字の領域を原画
像101から取り除き、その周囲の画像データで補間
し、画像Aを生成する文字部補間部である。106は画
像Aを入力し、縮小して画像Bを生成する縮小部であ
る。107は画像Bを入力し、JPEG圧縮して圧縮コ
ードX112を生成するJPEG圧縮部である。108
は文字領域座標111を入力し、その座標内の二値画像
103を参照しながら、二値画像の文字部を抽出する文
字抽出部である。109は文字抽出部により抽出された
文字画像である。110は、文字画像を入力し、MMR
圧縮して複数の圧縮コードY113を生成するMMR圧
縮部である。114は111から113までのデータを
結合させた圧縮データである。115は圧縮データ11
4を保持する記憶デバイスである。
【0034】さらに詳細を説明する。図2に二値化部1
02から文字領域検出部104までのフローチャートを
示す。スキャナ等から画像を入力し、当該画像を間引処
理し、解像度を落しながら輝度変換を行い、輝度画像J
を生成する(S301)。たとえば、原画像がRGB、
24bit、300dpiだとすると、縦方向、横方向
とも4画素ごとに次式の演算を行い新しい画像Jを生成
する。
【0035】 Y=0.299×R+0.587×G+0.114×B その結果、画像JはYが8bit、75dpiの画像と
なる。輝度データのヒストグラムを取り、二値化閾値T
を算出する(S302)。輝度画像Jを二値化閾値Tに
て二値化し、二値画像Kを生成する(S303)。黒画
素の輪郭線追跡を行いすべての黒領域をラベル付けする
(S304)。黒領域中の文字らしい領域を判定する
(S305)。形や位置から結合すべき画素を結合する
(S306)。
【0036】一例を示す。たとえば図3に示すカラー原
稿を入力し、間引いて輝度変換したもののヒストグラム
を取ると図4のようになる。このヒストグラムから平
均、分散、などのデータを利用して閾値T=150を算
出し、二値化した画像は図5のようになる。図5の黒画
素の輪郭線追跡を行い、すべてをラベリングする。たと
えば、横幅がある閾値以下の黒画素の集まり、または高
さがある閾値以下の黒画素の集まりのみを文字とする
と、図6に示す黒画素の集まりが文字領域となる。必要
に応じ、これらの黒画素の集まりを位置の近さや横幅、
高さの一致からグループ化していくと、図7に示すよう
な17個の文字領域が検出できる。これらの座標データ
が図1の111に格納される。
【0037】二値画像103を利用した文字部補間部1
05の処理の一例を図8と図9を用いて説明する。
【0038】図8aは原画像を示している。この原画像
から図8bに示すようなひとつの文字領域についての二
値画像を得たとする。本処理例では、画像を32×32
毎の領域(以下、パーツと称す。)に分割し(S110
1)、パーツ毎に処理を行う。図8cにパーツ毎に分け
たときの例を示す。分割された生成された各パーツは、
文字領域を含んでいるか否かを判定される(S110
3)。例えば、パーツ00からパーツ10までの6つの
パーツは、文字領域がないと判断され、処理は行われな
い。文字領域の存在するパーツ11は、対応する二値画
像8bを参照し、二値画像8bの白部分に対応するカラ
ー画像のRGB値(YUVなどのほかの色空間でも良
い)の平均値ave_colorが算出される(S11
04)。対応する二値画像8bを参照し、黒画素に対応
するカラー画像に前記ave_colorが代入される
(S1105)。以上の処理を文字領域の存在するパー
ツ12、13、21、22、23について、未処理パー
ツがなくなるまで繰り返し実施される(S1102)。
他のパーツは、文字領域がないので何も処理が行われな
い。このようにして、文字の存在する部分に、周囲の画
素データの平均値を補間することで文字部の画像データ
を補間する。
【0039】文字部補間部105で補間された画像は、
縮小化部106で縮小される。本実施形態では、単純間
引きとする。その他の縮小方法でも構わない。また、縮
小化部106と文字部補間部105は、順番を前後して
も構わない。その場合、二値画像103と原画像101
の解像度差による位置ずれを配慮する必要がある。
【0040】文字抽出部108の一例を図10に示す。
論理積部(AND)1203は、入力されたデータに対
して論理積を施す演算回路であり、二値画像103と文
字領域座標111が入力されるとその論理演算を実行
し、文字画像109を出力する。その時のイメージ図
を、図11に示す。二値画像11aと文字領域座標11
bの論理積をとった文字画像が11cとなる。これは一
例で、本手法に限るものではない。また、本実施形態で
は、二値画像には全面二値画像103を利用するがその
限りではなく、たとえば文字領域座標111と原画像1
01を入力し、原画像を改めて二値化した結果を利用し
て処理を行っても良い。
【0041】このようにして生成された文字画像109
は、MMR圧縮部110でMMR圧縮が施され、圧縮コ
ードY113が生成される。また、JPEG圧縮部10
7は、入力された縮小画像Bに対してJPEG圧縮を実
施し、圧縮コードX112を生成する。
【0042】以上の処理により生成された文字領域座標
111、圧縮コードX112、圧縮コードY113が含
まれたファイルをファイル作成部114で作成し、記憶
デバイス115に保存する。
【0043】図12に伸長時の構成図を示す。
【0044】JPEG伸長部201は、圧縮コードX1
12を入力し、JPEG伸長処理を行い、多値画像Eを
生成する。拡大部202は多値画像Eを入力し、画像の
拡大処理を行い、多値画像F203を出力する。MMR
伸長部204は圧縮コードY113を入力し、二値画像
G205を生成する。画像合体部206は、文字領域の
座標111と、それに対応する二値画像G205を入力
し、二値画像の画素データが透過をあらわす場合は画像
F203の画素の色を採用し、一方で、二値画像の画素
データが透過以外の値である場合には、当該画像は文字
であるため、例えば黒色を採用し、最終的な画像である
伸長画像H207を生成する。
【0045】図13に合体処理部206の処理結果の例
を示す。まず図13aに圧縮コードXのJPEG伸長結
果を示す。これは、図8の画像を利用したが、JPEG
圧縮の量子化非可逆方式を利用すると、図8とは微妙に
画素値が異なるデータとなっている。しかし、文字部補
間する前の原画像をJPEG非可逆圧縮方式で圧縮する
場合と比較して、同じ量子化テーブルを利用すれば画素
値の変化は少ない。本例では、文字領域座標は13bの
ように二値画像1bitで表現されている。二値画像1
3bを参照して黒画素の対応するところは文字として、
画像13a上に文字画像データ、ここではR=0、G=
0、B=0をのせ、最終的に13cのような画像が出来
上がる。これが伸長画像207となる。
【0046】また、合体処理部206は、文字領域座標
111、圧縮コードX112、圧縮コードY113の3
つをまとめたフォーマットを必要に応じて生成してもよ
い。3つをまとめるフォーマットの一例としてAdob
e社のPDF(Portable Document F
ormat、以下PDFと呼ぶ。)などが考えられる。
Adobe社のPDFとは、Adobe社が無償配布し
ているAcrobatReaderというアプリケーシ
ョンで表示できるフォーマットである。これを利用する
ことで、ドキュメントを生成したアプリケーションがな
いために、受け手側でファイルを開けないなどのトラブ
ルを避けることが出来る。その他のフォーマットとして
は、XMLなどがある。XMLとは、ネットワークを介
して文書やデータを交換したり配布したりするための記
述言語である。従って、合体処理部206は、PDF変
換やXML変換を担当する。ここでは、いくつか例を挙
げたが、本願発明はこれらのフォーマットに限られもの
ではなく、他のフォーマットを採用してもよい。
【0047】以上のように、画像から文字部を切り出
し、文字部は二値圧縮で高い圧縮率を実現できる。ま
た、文字以外の画像部は、文字のあった部分を周囲の画
像データで補間することで多値圧縮時の圧縮率を高め、
さらには、解像度を下げることで高い圧縮率を実現でき
る。この結果、通常よりはるかに少ない容量で画像を保
持することが可能となり、大量のドキュメントを記憶装
置にファイリングするシステムを提供することが可能と
なる。
【0048】[第2の実施形態]一般には文字は黒色で表
現される場合が多いが、ときには赤色で表現されたり、
赤と青のスプライト模様で表現されたり、さらに、写真
画像等を文字にレンダリングする場合もある。
【0049】本実施形態では、上述のような色文字に対
しても、圧縮・伸長装置を以下のように構成することに
より、高圧縮率を保ちつつ、高品位の画像ファイリング
を行うことを目的とする。
【0050】図14に本実施形態の構成図を示す。
【0051】2001は原画像である。2002は原画
像を入力し、画像の最適二値化を行う画像二値化部であ
る。2003は画像二値化部により二値化された全面二
値化画像である。2004は全面二値化画像2003を
入力して文字領域を検出し、文字領域座標2012を生
成する文字領域検出部である。2005は文字領域座標
2012と二値画像2003を参照し、文字の領域を原
画像2001から取り除き、その周囲の画像データで補
間し、画像Aを生成する文字部補間部である。2006
は画像Aを入力し、縮小して画像Bを生成する縮小部で
ある。2007は画像Bを入力し、JPEG圧縮して圧
縮コードX2013を生成するJPEG圧縮部である。
2008は文字領域座標2012を入力し、その座標内
の原画像2001と二値画像2003を参照しながら二
値画像の黒部分の原画像色を算出し複数のパレット20
14を生成し、それにしたがって原画像の減色処理を行
う文字色抽出部である。2009は文字色抽出部200
8により減色された複数の文字領域の減色画像である。
2010は減色画像2009が1bitであるときに、
減色画像を入力しMMR圧縮して複数の圧縮コードY2
015を生成するMMR圧縮部である。2011は減色
画像2009が2bit以上であるときに、減色画像2
009を入力しZIP圧縮して複数の圧縮コードZ20
16を生成するZIP圧縮部である。最終的に2017
でまとめた2012から2016までのデータが結合し
てこれが圧縮データとなる。2019は圧縮データ20
17を保持する記憶デバイスである。
【0052】さらに詳細を説明する。文字色抽出部の一
例のフローチャートを図15に示す。二値画像は全面二
値画像2003を利用したがその限りでなく、たとえば
文字領域の座標とカラー画像のみ入力し、カラー画像を
改めて二値化した結果を利用して代表色演算処理を行っ
ても良い。
【0053】抽出された色数を表すカウンタnumを0
にリセットする(S2201)。抽出されたすべての文
字領域ごとに処理を行うので、未処理の文字座標がある
かどうかチェックし、あったら2202に進み、なかっ
たらendに進む(S2202)。その文字座標に対応
する二値画像の細線化処理を行い、スキャナ読み込み時
の下地から文字部への変化部にあたる黒を減らしてい
き、新しい二値画像newbiを生成する(S220
3)。次にnewbiの黒画素に対応する原画像のRG
Bの3次元ヒストグラムを取る(S2204)。この
際、普通にヒストグラムをとると、たとえば入力画像が
RGB各8bitだとすると、256×256×256
のヒストグラムが必要になる。文字部に必要なのは解像
度であり、階調はそれほど必要ないこと、また、スキャ
ナによる読み込み時のばらつきを押さえながら代表色を
算出するには多少の画素値の違いは無視した方が良いこ
と、などを鑑みると、これほどの細かなヒストグラムは
必要ない。たとえば、したがってこの例では、上位5b
itのRGB3次元ヒストグラムをとる。このヒストグ
ラムをとる際は、その文字領域に存在する黒画素の総数
pixelnumも算出する(S2204)。
【0054】本実施形態ではRGB空間を利用したが、
YUVなど他の色空間でも構わない。また、3次元ヒス
トグラムをとったが、各色それぞれの1次元ヒストグラ
ムを3つとってもかまわない。
【0055】RGB3次元ヒストグラムから最大値を算
出する(S2205)。本例ではすでに上位3bitの
みのヒストグラムを取り、スキャナのばらつきによるノ
イズを押さえたが、さらに、ヒストグラムの隣り合った
値の合計の最大値をとることにより、図16に示すよう
な2つのヒストグラムにまたがる本来の最大値を検出す
ることが可能となる。具体的にいうと、3次元ヒストグ
ラムなので、注目点と、R次元で隣り合った2つ、G次
元で隣り合った2つ、B次元で隣り合った2つの、計7
つのヒストグラム値の合計値の最大値を検出するなどが
考えられる。このように検出された最大値をcolR
[num]、 colG[num]、 colB[num]に代
入する(S2205)。
【0056】S2205にて検出された最大値を中心
に、たとえば3ステップずつ広げた正方形内に位置する
ヒストグラム値を0にする(S2206)。正方形の説
明を図17に図示する。図17は3次元ヒストグラムの
様子で、黒点で示したものがcolR[0], colG
[0], colB[0]とする。その点を中心に3ステップ
ずつ広げた合計7×7×7が前述の正方形である。ここ
で3ステップというと、上位5bitのヒストグラムな
ので256階調で24レベルに値する。これは一例であ
って、この限りでない。この正方形内のヒストグラム値
をpixelnumから引いたあと、0を代入する(S
2206)。
【0057】続いて、numをインクリメントする(S
2207)。
【0058】pixelnumがあらかじめ決められた
thre1以上かどうかチェックし、thre1以上で
あればS2205に進み、未満であればS2202に進
む(S2208)。
【0059】以上の処理をすべての文字座標に繰り返す
ことにより、すべての文字領域のパレットが生成され
る。文字色抽出処理内に存在する減色部2018は、こ
の領域のパレット数が1でならば、入力された二値画像
2003の文字領域部分を切り抜き、1部分二値画像を
生成する。それがその文字領域の減色画像となる。一
方、この領域のパレット数が2以上である場合、減色部
は原画像と二値画像を入力し、文字領域内の二値画像が
黒である画素の原画像の値をパレットの値に振り分け、
減色画像を生成する。割り振られるbit数は、二値画
像の白の部分として透過を示す1データが必要となるの
で、パレット数が3のときは透過データを1プラスして
4となるので2bit。パレット数が4のときは透過デ
ータを1プラスして5となるので3bitとなる。この
bit数は最終的に適応される画像フォーマットで表現
出来るbit数に準じる。この際たとえばパレット数が
著しく多く、多色化による画質向上、圧縮率向上の効果
が見られないと判断できる場合には多色化はやめ、下地
画像として保存することも考えられる。その場合は文字
領域座標情報2012からその文字領域を削除しなくて
はならない。また、文字部補間部2005の処理が行わ
れる前に文字領域座標情報から削除しなければならな
い。
【0060】このようにして生成された減色画像200
9が1bitの場合は2010にてMMR圧縮し、圧縮
コードYを生成する。また、減色画像2009が2bi
t以上の場合は2011にてZIP圧縮し、圧縮コード
Zを生成する。一方、縮小画像B2006をJPEG圧
縮し、圧縮コードXを生成する。文字領域座標201
2、パレット2014、圧縮コードX2013、圧縮コ
ードY2015、圧縮コードZ2016の5つをまとめ
たフォーマットで、記憶デバイス2019に保存する。
【0061】図18に伸長時の構成図を示す。
【0062】2101は圧縮コードX2013を入力
し、JPEG伸長処理を行い、多値画像Eを生成するJ
PEG伸長部である。2102は多値画像Eを入力し、
拡大処理を行う拡大部である。2103は拡大部210
2により拡大された多値画像Fである。2104は圧縮
コードY2015を入力し、二値画像G2105を生成
するMMR伸長部である。2106は圧縮コードZ20
16を入力し、多色画像H2107を生成するZIP伸
長部である。2108は、文字領域の座標2012とそ
れに対応するパレット2014および二値画像G210
5または多色画像H2107を入力し、二値画像または
多色画像の画素データが透過をあらわす場合は画像F2
103の画素の色を、それ以外のときは対応するパレッ
ト色を選択し最終的な画像である画像I2109を生成
する画像合体部である。
【0063】図19に合体処理2108の結果例を示
す。まず図19aに圧縮コードCのJPEG伸長結果を
示す。これは、図10の画像を利用したが、JPEG圧
縮の量子化非可逆方式を利用すると図10とは微妙に画
素値が異なるデータとなっている。しかし、文字部を抜
く前の元画像をJPEG非可逆圧縮方式で圧縮する場合
と比較して、同じ量子化テーブルを利用した場合におい
て画素値の変化は少ない。本例では文字領域座標は19
bのように二値画像1bitで表現されていて、そのパ
レットはR=20、G=30、B=255とする。二値
画像19bを参照して黒画素の対応するところの画像1
9a上にパレット色(20、30、255)データをの
せ、最終的に19cのような画像が出来上がる。これが
伸長画像2109となる。多色画像の場合はパレット数
が変わり、たとえば2bitなら00、01、10、1
1の4つの画素値に割り当てられたパレットを当てはめ
ていく。そのうち1つは透過を示し、たとえば00とす
ると、00の値をもつ画素は画像19aの画素を選択す
る。
【0064】以上のように、画像から文字部を切り出
し、文字部の色をパレット表記することで、黒文字部は
二値圧縮で高い圧縮率を実現し、色文字部は多値圧縮と
パレットで色を再現できる。また、文字以外の画像部
は、文字のあった部分を周囲の画像データで補間するこ
とで多値圧縮時の圧縮率を高め、さらには、解像度を下
げることで高い圧縮率を実現できる。この結果、通常よ
りはるかに少ない容量で画像を保持することが可能とな
り、大量のドキュメントを記憶装置にファイリングする
システムを提供することが可能となる。
【0065】本実施形態では、文字部をMMR圧縮とZ
IP圧縮のふたつに分けたが、ZIP圧縮のみで構成し
ても良い。
【0066】[第3の実施形態]本実施形態は、第1の実
施形態や第2の実施形態で説明した画像の圧縮及び伸長
技術の応用例である。より具体的には、文書や画像デー
タを電子的にファイリングするファイリングシステムに
関するものである。もちろん、このファイリングシステ
ムは、図20及び図21に示すように単体の装置として
構成してもよいし、図22に示すようにネットワークを
介して接続された装置間で機能を分担して構成してもよ
い。
【0067】まず、はじめに単体の装置で構成する実施
形態を説明する。
【0068】図20に、本実施形態に係るマルチファン
クションマシンの構成を示す。このマルチファンクショ
ンマシンは複写機などに代表される装置である。
【0069】本実施形態に係るマルチファンクションマ
シンの構成は、リーダ部1とプリンタ部2に大別して説
明することができる。
【0070】リーダ部1の原稿給送装置1511は原稿
を最終頁から順に1枚ずつプラテンガラス1512上へ
給送し、原稿の読み取り動作終了後、プラテンガラス1
512上の原稿を排出するものである。原稿がプラテン
ガラス1512上に搬送されると、ランプ1513を点
灯し、そしてスキャナユニット1514の移動を開始さ
せて、原稿を露光走査する。この時の原稿からの反射光
は、ミラー1515、1516、1517、及びレンズ
1518によってCCDイメージセンサ(以下CCDと
呼ぶ。)1519へ導かれる。このように走査された原
稿の画像はCCD1519によって読み取られる。CC
D1519から出力される画像データは、所定の処理が
施された後、プリンタ部2へ転送される。
【0071】プリンタ部2のレーザドライバ1532は
レーザ発光部1521を駆動するものであり、リーダ部
1から出力された画像データに応じたレーザ光をレーザ
発光部1521に発光させる。このレーザ光は感光ドラ
ム1522に照射され、感光ドラム1522にはレーザ
光に応じた潜像が形成される。この感光ドラム1522
の潜像の部分には現像器1523によって現像剤が付着
される。そして、レーザ光の照射開始と同期したタイミ
ングで、カセット1524及びカセット1525のいず
れかから記録紙を給紙して転写部1526へ搬送し、感
光ドラム1522に付着された現像剤を記録紙に転写す
る。現像剤の乗った記録紙は定着部1527に搬送さ
れ、定着部1527の熱と圧力により現像剤は記録紙に
定着される。定着部1527を通過した記録紙は排出ロ
ーラ1528によって排出され、ソータ1531は排出
された記録紙をそれぞれのピンに収納して記録紙の仕分
けを行う。なお、ソータ1531は仕分けが設定されて
いない場合は最上ピンに記録紙を収納する。また、両面
記録が設定されている場合は、排出ローラ1528のと
ころまで記録紙を搬送した後、排出ローラ1528の回
転方向を逆転させ、フラッパ1529によって再給紙搬
送路へ導く。多重記録が設定されている場合は、記録紙
を排出ローラ1528まで搬送しないようにフラッパ1
529によって再給紙搬送路へ導く。再給紙搬送路へ導
かれた記録紙は上述したタイミングで転写部1526へ
給紙される。
【0072】図21は、第3の実施形態に係る画像ファ
イリング装置の構成例を示している。
【0073】入力装置1601は、原稿を読み取る読取
装置(リーダ部1)で構成され、1枚ないし複数の画像
を連続して読み取ることができる。圧縮装置1602
は、画像部から文字を切り出し、文字領域と写真領域と
を分けて圧縮する装置で、例えば、第1の実施形態や第
2の実施形態で開示された技術に基づくものである。記
憶装置1603は、メモリやハードディスク、CD−R
OM、DVD−ROMといった、一時的、あるいは、恒
久的にデータを記憶する装置である。出力装置1604
は、たとえば図20に示すように、データを可視化する
印字装置または表示装置である。通信装置1607は、
ネットワークに接続し、他の機器とデータを送受するた
めの装置である。図21にはさらにインデクス装置16
05も記述されているが、ファイリングシステムに必ず
必要というわけではない。インデクス装置1605は、
複数の原稿画像を一の紙面に若しくは一の画面に出力す
るための編集装置である。詳細は後述する。
【0074】図22に、ネットワークにおいて本願発明
を適用する場合の一実施形態を示す。本実施形態では、
第1の実施形態で開示した画像圧縮装置や画像伸長装置
を用いて画像ファイリングシステムを構築するものであ
る。とりわけ、本実施形態では、ネットワーク上で画像
ファイリングシステムを構築しようとするものである。
【0075】初めに、ネットワーク構成について説明す
る。1670はインターネットや公衆回線網などの通信
網である。もちろん、社内のLANとしてネットワーク
を構築してもよい。1690は、データの管理などを行
うファイルサーバであり、必要に応じてPC、複写機又
はプリンタ等にデータを出力する。
【0076】1610は、画像の読取から圧縮までを担
当する画像処理装置である。より詳細には、画像処理装
置1610は、入力装置1601、圧縮装置1602、
記憶装置1603及び通信装置1607等を備えてお
り、圧縮画像のデータをファイルサーバ1690に格納
したり(R01)、画像処理装置1620、1640又
は1650に送信したりする(R03、R04、R0
5)。
【0077】1630は、画像を読み取り、圧縮、圧縮
された複数の画像のレイアウト化及びインデクスの作成
までを担当する画像処理装置である。より詳細には、画
像処理装置1630は、入力装置1601、圧縮装置1
602、記憶装置1603、インデクス作成装置160
5及び通信装置1607等を備えており、複数の圧縮画
像を作成し、さらにこれらのインデクスを作成し、ファ
イルサーバ1690に格納したり(Q01)、画像処理
装置1640に送信したりする(Q02)。
【0078】1650は、ファイルサーバ1690や他
の画像処理装置1610から受信した複数の圧縮画像に
対してレイアウト化しインデクスを作成する画像処理装
置である。より詳細には、画像処理装置1650は、イ
ンデクス作成装置1605及び通信装置1607等を備
えており、受信した複数の圧縮画像についてインデクス
を作成し、ファイルサーバ1690に格納したり、画像
処理装置1640に送信したりする(Q03)。
【0079】1620は、画像処理装置1610やファ
イルサーバ1690から圧縮画像を受信して(R02、
R03)、伸長し、複数の圧縮画像からインデクスを作
成して出力する画像処理装置である。より詳細には、画
像処理装置1620は、圧縮画像を受信するための通信
装置1607、圧縮画像を伸長する伸長装置1606、
複数の伸長画像からインデクスを作成するインデクス作
成装置1605及び作成されたインデクスを出力する出
力装置1604を備えている。
【0080】1640は、画像処理装置1610やファ
イルサーバから圧縮画像やインデクスデータを受信し
(R05など)、伸長して出力したり、あるいは、画像
処理装置1630、1650またはファイルサーバ16
90からインデクスデータを受信し(Q02、Q03、
Q04)、伸長して出力したりする画像処理装置であ
る。
【0081】なお、いずれの画像処理装置も、PCや、
複写機、ファクシミリ等のマルチファンクションマシン
により具現化することが可能である。また、上述の構成
は一例であり、図示した以外の組み合わせであってもよ
い。
【0082】次にインデクス作成装置1605を詳細に
説明する。
【0083】本実施形態では、図23に示す文字と自然
画で構成される9枚のドキュメントをファイリングする
ものと仮定する。9つの原稿には、文字のみ、自然画の
みのドキュメントもあるが、両者から構成される原稿も
多い。また、文字部に背景が存在する原稿もある。この
ようなドキュメントを高圧縮率で高品位にファイリング
して保存するには、文字部と自然画部を切り分け、それ
ぞれに効果的な圧縮を施す本願発明が有効である。
【0084】画像ドキュメントのファイリングにおいて
は、とりわけ、どのようなドキュメントをファイリング
したかをわかりやすく整理することが重要である。そこ
で、ドキュメントのファイリングの際、同時にインデク
スを出力する。このようにすれば、圧縮画像をわかりや
すく整理できるとともに、検索の際にも容易に必要な圧
縮画像を抽出することができる。
【0085】インデクスは、1ドキュメントにつき1イ
ンデクスでも構わないが、大量のドキュメントを効果的
にファイリングするには、縮小してレイアウト配置する
ことが望ましい。縮小レイアウトする際の画像の枚数や
位置は、必要に応じて設定すれば良い。図23の9枚の
ドキュメントを例にとり、そのインデクス画像の例を図
24に示す。9枚のドキュメント画像を1枚のインデク
ス画像に配置した例である。
【0086】インデクス画像には、図25に示すよう
に、ドキュメントのキーワードなどを記載するとさらに
有効である。このキーワード1901は、ファイリング
装置の操作部から手入力しても良いし、本願発明の圧縮
時に文字画像を生成する機能を利用し、その画像から文
字認識処理により文字を抽出し、自動生成しても良い。
【0087】さらに、インデクスは、圧縮時に抽出した
文字だけで構成しても良いし、逆に、自然画部のみで構
成しても良い。
【0088】また、作成したインデクスは、文字領域座
標111、圧縮コードX112、圧縮コードY113の
3つをまとめた状態114と一緒に、記憶デバイス11
5に保存する構成をとっても良い。
【0089】図26に、本実施形態におけるインデクス
作成装置を示す。インデクス作成装置1605は、記憶
装置1603から二値画像Gを読み出して、文字認識処
理を実行する文字認識部3001と、文字認識部300
1において得られた文字について、例えば、最も出現頻
度が高い単語をキーワードとして抽出するキーワード抽
出部3002と、操作部からの指定に基づいてレイアウ
トのフォーマット決定するレイアウト決定部3003
と、レイアウト決定部3003で決定されたフォーマッ
トに合致するように伸長画像Hのサイズをサイズ調整部
3004と、レイアウト決定部3003で決定されたフ
ォーマットに沿ったインデクスを作成するレイアウト処
理部3005を備えている。
【0090】詳細に説明すると、レイアウト決定部30
03では、一のインデクスに表示する画像の枚数や画像
の並び等を決定する。例えば、予めいくつかのフォーマ
ットを用意しておき、ユーザに選択させるようにする。
選択は、操作部を操作することにより、その操作内容を
レイアウト決定部3003で判定し、ユーザの希望する
フォーマットを決定することになる。
【0091】サイズ調整部3004では、決定されたフ
ォーマットが例えば4枚の画像を表示するものであれ
ば、インデクス内に4枚の画像が収まるように、適宜画
像を縮小又は拡大し、サイズを調整する。
【0092】レイアウト処理部3005では、サイズ調
整後の画像とキーワードを、決定されたフォーマットに
レイアウトしてインデクスを作成し出力する。なお、キ
ーワードは、直接操作部から入力されたものであっても
よい。
【0093】以上のように、圧縮・記憶する際、インデ
クス画像、特に、縮小レイアウトしたインデクス画像を
出力することで、効果的にドキュメント画像がファイリ
ングできる装置を提供することが可能となる。
【0094】[他の実施形態]なお、本願発明は、複数の
機器(例えばホストコンピュータ、インタフェイス機
器、リーダ、プリンタなど)から構成されるシステムに
適用しても、一つの機器からなる装置(例えば、複写
機、ファクシミリ装置など)に適用してもよい。
【0095】また、本願発明の目的は、前述した実施形
態の機能を実現するソフトウエアのプログラムコードを
記録した記憶媒体(または記録媒体)を、システムある
いは装置に供給し、そのシステムあるいは装置のコンピ
ュータ(またはCPUやMPU)が記憶媒体に格納され
たプログラムコードを読み出し実行することによって
も、達成されることは言うまでもない。この場合、記憶
媒体から読み出されたプログラムコード自体が前述した
実施形態の機能を実現することになり、そのプログラム
コードを記憶した記憶媒体は本願発明を構成することに
なる。また、コンピュータが読み出したプログラムコー
ドを実行することにより、前述した実施形態の機能が実
現されるだけでなく、そのプログラムコードの指示に基
づき、コンピュータ上で稼働しているオペレーティング
システム(OS)などが実際の処理の一部または全部を
行い、その処理によって前述した実施形態の機能が実現
される場合も含まれることは言うまでもない。
【0096】さらに、記憶媒体から読み出されたプログ
ラムコードが、コンピュータに挿入された機能拡張カー
ドやコンピュータに接続された機能拡張ユニットに備わ
るメモリに書き込まれた後、そのプログラムコードの指
示に基づき、その機能拡張カードや機能拡張ユニットに
備わるCPUなどが実際の処理の一部または全部を行
い、その処理によって前述した実施形態の機能が実現さ
れる場合も含まれることは言うまでもない。
【0097】本願発明を上記記憶媒体に適用する場合、
その記憶媒体には、先に説明した図2又は図15に示す
フローチャートに対応するプログラムコードが格納され
ることになる。
【0098】
【発明の効果】本願発明の第1の観点によれば、文字や
写真等が混在した文書データであっても効率よく圧縮す
ることの可能な画像処理装置等を提供できる。
【0099】さらに、本願発明の第2の観点によれば、
文字の色が一般的な黒ではなく、他の色であったり、複
数の色からなる場合であっても、効率良く、しかも原画
像に対して忠実に圧縮することの可能な画像処理装置等
を提供できる。
【0100】また、本願発明の第3の観点によれば、本
願発明の画像圧縮方法で圧縮された文書データを伸長す
ることの可能な画像処理装置を提供できる。
【0101】さらに、本願発明の第4の観点によれば、
上述の画像処理装置を応用し、複数の原画像をファイリ
ングする画像処理システムを提供できる。
【0102】また、本願発明の第5の観点によれば、複
数の原画像を管理する際に役立つインデクスを作成する
画像処理システムを提供できる。
【0103】このように本願発明によれば、画像ファイ
リングシステムにおいて、文字と自然画を個別に扱うこ
とで、高圧縮、高品位にドキュメントファイリングが行
える。また、インデクスを出力することで、効率良く、
かつ、有効なドキュメントファイリングが行える。
【図面の簡単な説明】
【図1】第1の実施形態での圧縮ブロック図である。
【図2】本願発明に係る文字領域検出のフローチャート
である。
【図3】本願発明に係る文字領域検出処理を説明するた
めの図である。
【図4】本願発明に係る文字領域検出処理を説明するた
めの図である。
【図5】本願発明に係る文字領域検出処理を説明するた
めの図である。
【図6】本願発明に係る文字領域検出処理を説明するた
めの図である。
【図7】本願発明に係る文字領域検出処理を説明するた
めの図である。
【図8】本願発明に係る文字部補間処理を説明する図で
ある。
【図9】本願発明に係る文字部補間処理のフローチャー
トである。
【図10】第1の実施形態での文字抽出部のブロック図
である。
【図11】第1の実施形態での文字抽出部処理を説明す
る図である。
【図12】第1の実施形態での伸長ブロック図である。
【図13】本願発明に係る伸長時の合体部の説明であ
る。
【図14】第2の実施形態での圧縮ブロック図である。
【図15】第2の実施形態での文字色抽出部のフローチ
ャートである。
【図16】第2の実施形態での文字色抽出部の代表値算
出の一例である。
【図17】第2の実施形態での文字色抽出部の正方形を
説明する図である。
【図18】第2の実施形態での伸長ブロック図である。
【図19】第2の実施形態での伸長時の合体部の説明で
ある。
【図20】第3の実施形態での画像入出力装置の説明図
である。
【図21】第3の実施形態の構成を説明する図である。
【図22】第3の実施形態での通信網の説明図である。
【図23】第3の実施形態でのドキュメントの例であ
る。
【図24】第3の実施形態でのインデクスを説明する図
である。
【図25】第3の実施形態でのインデクスを説明する図
である。
【図26】第3の実施形態でのインデクス作成装置のブ
ロック図である。
【符号の説明】
101 原画像 102 二値化部 103 全面二値化画像 104 文字領域検出部 105 文字部補間部 106 縮小化部 107 JPEG圧縮部 108 文字抽出部 109 文字画像 110 MMR部 111 文字領域座標データ 112 圧縮コードX 113 圧縮コードY 114 保存ファイル 115 記憶デバイス
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04N 1/40 H04N 1/40 F 5C078 7/24 7/13 Z 5L096 Fターム(参考) 5B050 AA09 BA06 BA10 BA16 DA04 DA06 EA06 EA08 EA09 EA10 EA12 EA19 GA08 5B057 AA11 BA02 BA30 CA01 CA08 CA12 CA16 CB01 CB08 CB12 CB16 CC03 CD05 CE01 CE08 CE12 CE16 CE17 CF01 CG02 CG04 DA08 DB02 DB05 DB08 DC17 DC19 5C059 KK04 MA23 MB01 MB17 MB21 PP01 PP02 PP15 PP20 PP24 PP29 SS06 SS20 UA02 UA38 UA39 5C076 AA02 BA06 5C077 LL19 MP06 MP08 PP21 PP27 PP28 PP58 PQ08 RR06 RR19 RR21 5C078 AA04 AA09 BA27 BA53 BA57 CA02 CA21 DA01 DA02 DA22 DB05 5L096 AA02 AA06 BA17 CA14 EA43 FA06 FA15 FA35 FA44 GA34

Claims (23)

    【特許請求の範囲】
  1. 【請求項1】原画像から文字領域と、該原画像内におけ
    る該文字領域の位置を検出する検出手段と、 前記原画像から前記文字領域の存在を低減し、低減画像
    を作成する低減手段と、 前記低減画像を情報圧縮し、第1の圧縮データを作成す
    る第1の圧縮手段と、 前記検出手段により検出された前記文字領域の画像を情
    報圧縮し、第2の圧縮データを作成する第2の圧縮手段
    と、 前記第1の圧縮データ、前記第2の圧縮データ及び前記
    文字領域の位置に関する情報を含む保存データを作成す
    る作成手段と、 を備えることを特徴とする画像処理装置。
  2. 【請求項2】前記低減手段は、 前記原画像から前記文字領域を除去する除去手段と、 前記除去手段により除去された領域に対して補間処理を
    施す補間手段と、 を備えることを特徴とする請求項1に記載の画像処理装
    置。
  3. 【請求項3】前記第1の圧縮手段は多値画像を圧縮する
    手段であり、前記第2の圧縮手段は二値画像を圧縮する
    手段であることを特徴とする請求項1に記載の画像処理
    装置。
  4. 【請求項4】前記文字領域の画像を減色し減色画像を生
    成する減色手段をさらに備え、 前記第2の圧縮手段は、前記減色画像を情報圧縮し、第
    2の圧縮データを作成することを特徴とする請求項1に
    記載の画像処理装置。
  5. 【請求項5】前記減色画像が二値画像であるか否かを判
    定する判定手段とをさらに備え、 前記第2の圧縮手段は、前記判定手段により前記減色画
    像が二値画像であると判定された場合には第1の情報圧
    縮手法を用いて該減色画像を圧縮し、前記減色画像が二
    値画像ではないと判定された場合には第2の情報圧縮手
    法を用いて該減色画像を圧縮することを特徴とする請求
    項4に記載の画像処理装置。
  6. 【請求項6】前記文字領域の画像の代表色を抽出する色
    抽出手段をさらに備え、 前記作成手段は、前記抽出手段により抽出された前記代
    表色に関するデータを含めて前記保存データを作成する
    ことを特徴とする請求項4乃至請求項5の何れか一つに
    記載の画像処理装置。
  7. 【請求項7】複数の前記保存データを記憶する記憶手段
    と、 前記記憶手段に記憶された複数の前記保存データを読出
    し、複数の前記保存データに関するインデクスを作成す
    るインデクス作成手段と、 前記インデクス作成手段により作成された前記インデク
    スを出力する出力手段と、 を備えることを特徴とする請求項1乃至請求項6の何れ
    か一つに記載された画像処理装置。
  8. 【請求項8】前記インデクス作成手段は、前記保存デー
    タに含まれる前記第2の圧縮データに対して文字認識処
    理を実行する文字認識手段を備え、前記インデクス作成
    手段は、前記文字認識手段により文字認識された文字列
    を含むインデクスを作成することを特徴とする請求項7
    に記載の画像処理装置。
  9. 【請求項9】文字列を入力するための文字列入力手段を
    さらに備え、 前記インデクス作成手段は、前記文字列入力手段から入
    力された文字列を含むインデクスを作成することを特徴
    とする請求項7に記載の画像処理装置。
  10. 【請求項10】前記インデクス作成手段は、 インデクスのレイアウトを選択する選択手段と、 前記保存データに含まれる第1の圧縮データを伸長して
    伸長画像を作成し、前記選択手段により選択されたレイ
    アウトに基づいて、前記伸長画像のサイズを調整するサ
    イズ調整手段と、 をさらに備えることを特徴とする請求項7に記載の画像
    処理装置。
  11. 【請求項11】原画像に含まれる文字領域を除外してな
    る残余の画像を情報圧縮して生成された第1の圧縮デー
    タと、該文字領域の画像を情報圧縮して生成された第2
    の圧縮データと、該原画像内における該文字領域の位置
    に関する位置データとを含む保存データを記憶する記憶
    手段と、 前記記憶手段から前記保存データを読み出して、該読み
    出された保存データに含まれる前記第1の圧縮データに
    基づいて前記残余の画像を伸長する第1の伸長手段と、 前記記憶手段から前記保存データを読み出して、該読み
    出された保存データに含まれる前記第2の圧縮データに
    基づいて前記文字領域の画像を伸長する第2の伸長手段
    と、 前記記憶手段から前記保存データを読み出して前記位置
    データを取得し、該位置データに基づいて前記文字領域
    の画像と前記残余の画像とを合成する合成手段と、 前記合成手段により合成されてなる合成画像を出力する
    出力手段と、 を備えることを特徴とする画像処理装置。
  12. 【請求項12】前記第1の伸長手段は、前記第1の圧縮
    データを多値伸長し、前記第2の伸長手段は、前記第2
    の圧縮データを二値伸長することを特徴とする請求項1
    2に記載の画像処理装置。
  13. 【請求項13】前記保存データには、さらに、前記第2
    の圧縮データに関するパレット情報が含まれており、 前記合成手段は、前記パレット情報に基づいて前記文字
    領域の画像にパレットを当てはめ、前記合成画像を作成
    することを特徴とする請求項11に記載の画像処理装
    置。
  14. 【請求項14】複数の前記合成画像に関するインデクス
    を作成するインデクス作成手段をさらに備え、 前記出力手段は、前記インデクス作成手段により作成さ
    れた前記インデクスを出力することを特徴とする請求項
    11乃至請求項13の何れか一つに記載された画像処理
    装置。
  15. 【請求項15】前記インデクス作成手段は、前記文字領
    域の画像に対して文字認識処理を実行する文字認識手段
    を備え、前記文字認識手段により文字認識された文字列
    を含むインデクスを作成することを特徴とする請求項1
    4に記載の画像処理装置。
  16. 【請求項16】文字列を入力するための文字列入力手段
    をさらに備え、 前記インデクス作成手段は、前記文字列入力手段から入
    力された文字列を含むインデクスを作成することを特徴
    とする請求項14に記載の画像処理装置。
  17. 【請求項17】前記インデクス作成手段は、 インデクスのレイアウトを選択する選択手段と、 前記選択手段により選択されたレイアウトに基づいて、
    前記合成画像のサイズを調整するサイズ調整手段と、 をさらに備えることを特徴とする請求項14に記載の画
    像処理装置。
  18. 【請求項18】ネットワークを介して接続された第1の
    画像処理装置と第2の画像処理装置とを備える画像処理
    システムであって、 前記第1の画像処理装置は、 原画像から文字領域と、該原画像内における該文字領域
    の位置を検出する検出手段と、 前記原画像における前記文字領域の存在を低減して低減
    画像を生成する低減手段と、 前記低減手段により生成された前記低減画像を情報圧縮
    し、第1の圧縮データを作成する第1の圧縮手段と、 前記検出手段により検出された前記文字領域の画像を情
    報圧縮し、第2の圧縮データを作成する第2の圧縮手段
    と、 前記第1の圧縮データ、前記第2の圧縮データ及び前記
    文字領域の位置に関する情報を含む保存データを作成す
    る作成手段と、 前記作成手段により作成された前記保存データを前記ネ
    ットワークを介して前記第2のが像処理装置に送信する
    送信手段と、 を備え、 前記第2の画像処理装置は、 前記送信手段から送信される前記保存データを受信する
    受信手段と、 前記受信手段により受信された前記保存データに含まれ
    る前記第1の圧縮データに基づいて前記低減画像を伸長
    する第1の伸長手段と、 前記保存データに含まれる前記第2の圧縮データに基づ
    いて前記文字領域の画像を伸長する第2の伸長手段と、 前記保存データに含まれる前記位置データを取得し、該
    位置データに基づいて前記文字領域の画像と前記低減画
    像とを合成する合成手段と、 前記合成手段により合成されてなる合成画像を出力する
    出力手段と、 を備えることを特徴とする画像処理システム。
  19. 【請求項19】複数の前記合成画像に関するインデクス
    を作成するインデクス作成手段をさらに備え、 前記出力手段は、前記インデクス作成手段により作成さ
    れた前記インデクスを出力することを特徴とする請求項
    18に記載の画像処理システム。
  20. 【請求項20】原画像から文字領域と、該原画像内にお
    ける該文字領域の位置を検出するステップと、 前記原画像における前記文字領域の画像の存在を低減す
    るステップと、 前記文字領域の存在を前記原画像から低減して低減画像
    を生成するステップと、 前記低減画像を情報圧縮して第1の圧縮データを作成す
    るステップと、 検出された前記文字領域の画像を情報圧縮し、第2の圧
    縮データを作成するステップと、 前記第1の圧縮データ、前記第2の圧縮データ及び前記
    文字領域の位置に関する情報を含む保存データを作成す
    るステップと、 を備えることを特徴とする画像処理方法。
  21. 【請求項21】原画像に含まれる文字領域を除外してな
    る残余の画像を情報圧縮して生成された第1の圧縮デー
    タと、該文字領域の画像を情報圧縮して生成された第2
    の圧縮データと、該原画像内における該文字領域の位置
    に関する位置データとを含む保存データを取得するステ
    ップと、 前記保存データに含まれる前記第1の圧縮データに基づ
    いて前記残余の画像を伸長するステップと、 前記保存データに含まれる前記第2の圧縮データに基づ
    いて前記文字領域の画像を伸長するステップと、 前記保存データに含まれる前記位置データに基づいて前
    記文字領域の画像と前記残余の画像とを合成するステッ
    プと、 前記合成画像を出力するステップと、 を備えることを特徴とする画像処理方法。
  22. 【請求項22】請求項1乃至請求項17の何れか一つに
    記載した画像処理装置であって、コンピュータを前記手
    段として機能させるための画像処理プログラム。
  23. 【請求項23】請求項20乃至請求項21の何れか一つ
    に記載した画像処理方法であって、前記画像処理の各ス
    テップをコンピュータに実行させるための画像処理プロ
    グラム。
JP2001171377A 2001-06-06 2001-06-06 画像処理装置、画像処理方法及び画像処理プログラム Withdrawn JP2002369011A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001171377A JP2002369011A (ja) 2001-06-06 2001-06-06 画像処理装置、画像処理方法及び画像処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001171377A JP2002369011A (ja) 2001-06-06 2001-06-06 画像処理装置、画像処理方法及び画像処理プログラム

Publications (1)

Publication Number Publication Date
JP2002369011A true JP2002369011A (ja) 2002-12-20

Family

ID=19013153

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001171377A Withdrawn JP2002369011A (ja) 2001-06-06 2001-06-06 画像処理装置、画像処理方法及び画像処理プログラム

Country Status (1)

Country Link
JP (1) JP2002369011A (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007174079A (ja) * 2005-12-20 2007-07-05 Fuji Xerox Co Ltd 履歴出力装置、履歴出力方法およびプログラム
WO2007129510A1 (ja) * 2006-05-10 2007-11-15 5Digistar Inc. 画像処理システム
JP2009194909A (ja) * 2008-02-13 2009-08-27 Toshiba Corp 文書画像フォ−マット処理装置及び方法
US8014620B2 (en) 2006-08-24 2011-09-06 Fuji Xerox Co., Ltd. Image processing system, image compression system, image editing system, computer readable medium, computer data signal and image processing apparatus
WO2012091180A1 (ja) * 2010-12-29 2012-07-05 コニカミノルタビジネステクノロジーズ株式会社 文字検出装置、文字検出方法、および記録媒体
WO2012091181A1 (ja) * 2010-12-29 2012-07-05 コニカミノルタビジネステクノロジーズ株式会社 文字検出装置、文字検出方法、および記録媒体
JP2016529783A (ja) * 2013-07-12 2016-09-23 クゥアルコム・インコーポレイテッドQualcomm Incorporated パレットベースのビデオコーディングにおけるパレット予測
CN112184835A (zh) * 2020-10-16 2021-01-05 深圳阿图科技有限公司 一种钢琴键盘图像的形变恢复方法及系统
US11259020B2 (en) 2013-04-05 2022-02-22 Qualcomm Incorporated Determining palettes in palette-based video coding

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007174079A (ja) * 2005-12-20 2007-07-05 Fuji Xerox Co Ltd 履歴出力装置、履歴出力方法およびプログラム
WO2007129510A1 (ja) * 2006-05-10 2007-11-15 5Digistar Inc. 画像処理システム
US8014620B2 (en) 2006-08-24 2011-09-06 Fuji Xerox Co., Ltd. Image processing system, image compression system, image editing system, computer readable medium, computer data signal and image processing apparatus
JP2009194909A (ja) * 2008-02-13 2009-08-27 Toshiba Corp 文書画像フォ−マット処理装置及び方法
WO2012091180A1 (ja) * 2010-12-29 2012-07-05 コニカミノルタビジネステクノロジーズ株式会社 文字検出装置、文字検出方法、および記録媒体
WO2012091181A1 (ja) * 2010-12-29 2012-07-05 コニカミノルタビジネステクノロジーズ株式会社 文字検出装置、文字検出方法、および記録媒体
JP2012142802A (ja) * 2010-12-29 2012-07-26 Konica Minolta Business Technologies Inc 文字検出装置、文字検出方法、およびコンピュータプログラム
US9098768B2 (en) 2010-12-29 2015-08-04 Konica Minolta, Inc. Character detection apparatus, character detection method, and computer-readable storage medium
US11259020B2 (en) 2013-04-05 2022-02-22 Qualcomm Incorporated Determining palettes in palette-based video coding
JP2016529783A (ja) * 2013-07-12 2016-09-23 クゥアルコム・インコーポレイテッドQualcomm Incorporated パレットベースのビデオコーディングにおけるパレット予測
CN112184835A (zh) * 2020-10-16 2021-01-05 深圳阿图科技有限公司 一种钢琴键盘图像的形变恢复方法及系统
CN112184835B (zh) * 2020-10-16 2024-01-19 深圳阿图科技有限公司 一种钢琴键盘图像的形变恢复方法及系统

Similar Documents

Publication Publication Date Title
JP3304858B2 (ja) 画像送信装置および画像送信方法
JP5036430B2 (ja) 画像処理装置及びその制御方法
JP5164368B2 (ja) 画像処理装置、画像処理方法
US7379214B2 (en) Image processing apparatus capable of processing image embedded with digital watermark, method for controlling the image processing apparatus, and storage medium storing program to execute the method
JP4366003B2 (ja) 画像処理装置及び画像処理方法
JP2003087563A (ja) 画像処理装置およびその制御方法
US6992686B2 (en) System and method for dynamic control of file size
JP2003163801A (ja) 画像処理装置および画像処理方法、画像処理プログラム、記憶媒体
JP2003179738A (ja) 画像処理装置
JP3715905B2 (ja) 画像処理装置、画像処理方法、プログラム並びに記憶媒体
US20080036774A1 (en) Image processing apparatus, image processing method and image processing program
JP5178490B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP2002369011A (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP2003244447A (ja) 画像処理装置及び画像処理方法
US7609881B2 (en) Device and method for image processing as well as image processing computer program
JPH03204274A (ja) カラー画像伝送方法
JP3899872B2 (ja) 画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体
US8270722B2 (en) Image processing with preferential vectorization of character and graphic regions
JP2003338935A (ja) 画像処理装置および方法
JP3940890B2 (ja) 画像処理装置および画像処理方法
JP4135656B2 (ja) 画像領域判定方法、画像処理装置およびプログラム
JP2003219187A (ja) 画像処理方法及び画像処理装置
JP2003348361A (ja) 画像処理装置
US8780374B2 (en) Image processing apparatus and image processing method
JP3821422B2 (ja) 画像データの圧縮方法,圧縮/伸張方法,記録媒体,圧縮器,画像記憶装置,画像読取装置および画像形成装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20080902