JP2003008909A - 画像処理装置、画像処理方法、プログラム並びに記憶媒体 - Google Patents

画像処理装置、画像処理方法、プログラム並びに記憶媒体

Info

Publication number
JP2003008909A
JP2003008909A JP2001193640A JP2001193640A JP2003008909A JP 2003008909 A JP2003008909 A JP 2003008909A JP 2001193640 A JP2001193640 A JP 2001193640A JP 2001193640 A JP2001193640 A JP 2001193640A JP 2003008909 A JP2003008909 A JP 2003008909A
Authority
JP
Japan
Prior art keywords
character
color
colors
image
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001193640A
Other languages
English (en)
Other versions
JP3715905B2 (ja
Inventor
Yukari Toda
ゆかり 戸田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2001193640A priority Critical patent/JP3715905B2/ja
Priority to US09/902,172 priority patent/US6999619B2/en
Priority to EP01305987A priority patent/EP1173003B1/en
Priority to DE60138073T priority patent/DE60138073D1/de
Priority to CNB200510054267XA priority patent/CN100348014C/zh
Priority to CNB011325208A priority patent/CN1201266C/zh
Publication of JP2003008909A publication Critical patent/JP2003008909A/ja
Priority to US11/246,301 priority patent/US7221790B2/en
Application granted granted Critical
Publication of JP3715905B2 publication Critical patent/JP3715905B2/ja
Priority to US11/678,914 priority patent/US7376267B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Color Image Communication Systems (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】文字領域に対し複数色を割当てる画像処理装
置、画像処理方法並びにその記憶媒体を提供すること。 【解決手段】 カラー画像データから検出された文字領
域に対し文字きり処理を行い(S3002)、文字領域
の文字を構成する複数の色から、いくつかの代表的な色
を導き出し、文字きり単位毎に代表的な色の内の1色を
割り当てる(S3004)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は画像処理装置、画像
処理方法、及びその方法を実現するプログラム並びに記
憶媒体に関するものである。
【0002】
【従来の技術】近年、スキャナの普及により文書の電子
化が進んでいる。電子化された文書をフルカラービット
マップ形式で記憶しようとすると、例えば、A4サイズ
の場合では300dpiで約24Mバイトにもなり、必
要なメモリが膨大になる。このような大容量のデータ
は、メイルに添付して送信するのに適したサイズとはい
えない。そこで、フルカラー画像を圧縮することが通常
行われており、その圧縮方式としてJPEGが知られて
いる。JPEGは写真などの自然画像を圧縮するには非
常に効果も高く、画質も良い。しかし一方で、文字部な
どの高周波部分をJPEG圧縮すると、モスキートノイ
ズと呼ばれる画像劣化が発生し、圧縮率も悪い。そこ
で、領域分割を行い、文字領域を抜いた下地部分のJP
EG圧縮と、色情報付き文字領域部分のMMR圧縮を作
成し、解凍時は白部分はJPEG画像を透過し、黒部分
は代表文字色を載せて表現する方法があった。
【0003】
【発明が解決しようとする課題】しかし、上記従来の方
法では文字領域は1領域につき1色でしか表現できず、
文字領域に複数の文字色が存在する場合には対応できな
かった。
【0004】本発明は上記従来技術の課題を解決するた
めになされたものであり、文字領域に対し複数色を割り
当てる画像処理装置、画像処理方法並びにその記憶媒体
を提供することを目的とする。
【0005】
【課題を解決するための手段】上記目的を達成するた
め、本発明に係る装置は、カラー画像データを2値化す
る2値化手段と、前記カラー画像データから文字領域を
検出する検出手段と、前記文字領域中の文字を構成する
N個の色から、N以下のM個の色を導き出す減色手段
と、前記文字領域に対し文字きり処理を行う文字きり手
段と、前記文字きり手段により得られた文字きり単位毎
に、前記M個の色の内、1色を割り当てる色割当て手段
と、を有することを特徴とする。
【0006】前記色割当て手段は、前記文字切り単位中
の文字を構成する複数画素の中で、最も多い画素数を占
める色を、前記M個の色から選択し、前記文字切り単位
中の文字を構成する全画素に割り当てることを特徴とす
る。
【0007】前記減色手段は、前記カラー画像データの
前記文字領域のRGB3次元ヒストグラムを用いて代表
色を抽出する抽出手段を含むことを特徴とする。
【0008】前記減色手段は、前記抽出手段によって抽
出された前記代表色のうち、1の代表色が下地色から他
の代表色への遷移的な色であるか否か判定し、遷移的な
色の場合には、前記他の代表色と同色として扱うことに
より、前記M個の色を導き出すことを特徴とする。
【0009】前記色割当て手段によって前記文字領域に
割り当てられた色の総数に応じて、異なる方法で圧縮す
る圧縮手段を更に有することを特徴とする。
【0010】前記圧縮手段は、前記文字領域に割り当て
られる色が1色の場合には、その文字領域に対してMM
R圧縮を行い、前記文字領域に割当てられる色が2色以
上、所定数S色未満の場合には、その文字領域に対して
ZIP圧縮を行い、前記文字領域に割当てられる色がS
色以上の場合には、JPEG圧縮を行うことを特徴とす
る。
【0011】上記目的を達成するため、本発明に係る方
法は、カラー画像データを2値化する2値化工程と、前
記カラー画像データから文字領域を検出する検出工程
と、前記文字領域中の文字を構成するN個の色から、N
以下のM個の色を導き出す減色工程と、前記文字領域に
対し文字きり処理を行う文字きり工程と、前記文字きり
工程により得られた文字きり単位毎に、前記M個の色の
内、1色を割り当てる色割当て工程と、を有することを
特徴とする。
【0012】上記目的を達成するため、本発明に係るプ
ログラムは、コンピュータに、カラー画像データを2値
化する2値化工程と、前記カラー画像データから文字領
域を検出する検出工程と、前記文字領域中の文字を構成
するN個の色から、N以下のM個の色を導き出す減色工
程と、前記文字領域に対し文字きり処理を行う文字きり
工程と、前記文字きり工程により得られた文字きり単位
毎に、前記M個の色の内、1色を割り当てる色割当て工
程と、を実行させる。
【0013】上記目的を達成するため、本発明に係る記
憶媒体は、コンピュータに、カラー画像データを2値化
する2値化工程と、前記カラー画像データから文字領域
を検出する検出工程と、前記文字領域中の文字を構成す
るN個の色から、N以下のM個の色を導き出す減色工程
と、前記文字領域に対し文字きり処理を行う文字きり工
程と、前記文字きり工程により得られた文字きり単位毎
に、前記M個の色の内、1色を割り当てる色割当て工程
と、を実行させるためのプログラムを格納したことを特
徴とする。
【0014】
【発明の実施の形態】以下に、図面を参照して、この発
明の好適な実施の形態を例示的に詳しく説明する。ただ
し、この実施の形態に記載されている構成要素の相対配
置、表示画面等は、特に特定的な記載がない限りは、こ
の発明の範囲をそれらのみに限定する趣旨のものではな
い。
【0015】<一実施の形態>本発明に係る画像処理装
置の一実施形態として、フルカラー画像を記憶媒体に格
納する際、或は、伝送媒体上で伝送する際に、原画像の
情報を残しつつ、効果的に圧縮する画像処理装置につい
て説明する。
【0016】[概要]本実施形態としての画像処理装置
は、まず、全画像領域について輝度ヒストグラムを生成
し、2値化して、いくつかの文字領域を取り出す。次
に、各文字領域について、文字切り処理を行い、その結
果から、再度文字領域として扱うべき領域か否か判断す
る。文字領域として扱うべき領域でない場合には、その
領域内のオブジェクトが単色かどうか判断し、単色の場
合にはMMR圧縮の対象とし、単色でなければ、JPE
G圧縮の対象とする。また、文字領域として扱うべき画
像と判断された場合には、その領域を構成する色を所定
の減色処理によって減らす。この減色処理の結果、1色
になった場合にはその色を示すパレット(例えば、
(R,G,B)=(20,30,40))と、2値画像
とを関連づけてMMR圧縮の対象とする。減色処理の結
果、所定の色数(例えば4色)以下で表すことができる
場合には、文字切り毎に、各色を示すパレットと、各色
の画素位置を示す多値画像と、を関連づけてZIP圧縮
の対象とする。所定の色数では表すことができない場合
には、減色処理前の原画像をJPEG圧縮処理の対象と
する。
【0017】[全体構成]図1に本発明を画像圧縮方法
に適応した時の構成図を示す。
【0018】101は原画像である。102は原画像を
入力し、画像の最適二値化を行う画像二値化部である。
103は画像二値化部により二値化された全面二値画像
である。104は全面二値画像103を入力して文字領
域を検出し、文字領域座標112を作成する文字領域検
出部である。
【0019】108は文字領域座標112を入力し、そ
の座標内の原画像と二値画像を参照しながら二値画像の
黒部分の原画像色を算出し複数のパレット114を作成
し、それにしたがって原画像の減色処理を行う文字色抽
出部である。
【0020】105は文字領域検出部104で文字とし
て検出された領域で、かつ文字色抽出部108にて文字
色がM色未満となった領域の二値画像103の黒の領域
を原画像から抜いて、その周りの色で塗りつぶし、画像
Aを作成する文字部塗りつぶし部である。
【0021】106は画像Aを入力し、縮小して画像B
を作成する縮小部である。
【0022】107は画像Bを入力し、JPEG圧縮し
て圧縮コードX(113)を作成するJPEG圧縮部で
ある。
【0023】109は文字色抽出部108により減色さ
れた複数の文字領域の減色画像である。110は減色画
像109が1ビットであるときに、減色画像を入力しM
MR圧縮して複数の圧縮コードY(115)を作成する
MMR圧縮部である。111は減色画像109が2ビッ
ト以上であるときに、減色画像を入力しZIP圧縮して
複数の圧縮コードZ(116)を作成するZIP圧縮部
である。最終的に1Aでまとめた112から116まで
のデータが結合してこれが圧縮データとなる。
【0024】[文字領域検出処理]図3は、文字領域検
出部104での処理を説明するフローチャートである。
ステップS301にてカラー画像を入力し、間引いて解
像度を落しながら輝度変換を行い、輝度画像Jを作成す
る。例えば原画像がRGB24ビット300dpiだと
すると、縦方向、横方向とも4画素ごとにY=0.29
9R+0.587G+0.114Bの演算を行い、新し
い画像Jを作成すると画像JはY8ビット75dpiの
画像となる。ステップS302にて輝度データのヒスト
グラムを取り、二値化閾値Tを算出する。
【0025】次にステップS303にて輝度画像Jを閾
値Tにて二値化し、二値画像Kを作成する。更にステッ
プS304にて黒画素の輪郭線追跡を行いすべての黒領
域をラベル付けする。次に、ステップS305にて黒領
域中の文字らしい領域を判定する。ステップS306に
て形や位置から結合するものを結合する。
【0026】一例を示す。例えば図4に示すカラー原稿
を入力し、間引いて輝度変換したもののヒストグラムを
取ると図5のようになる。このヒストグラムから平均、
分散、などのデータを利用して閾値T(例えば150)
を算出し、二値化した画像は図6のようになる。図6の
黒画素の輪郭線追跡を行い、すべてをラベリングして、
例えば、横幅が閾値以下、または高さが閾値以下の黒画
素の集まりのみ文字として認識すると図7に示す黒画素
の集まりが文字領域となる。ここでは説明のため図に表
したが、文字領域検出処理中に、実際にこのような画像
が作成されるわけではない。
【0027】これらの黒画素の集まりを位置の近さや横
幅、高さの一致からグループ化していくと、図8に示す
ような16個の文字領域が検出できる。これらの座標デ
ータが図1の文字領域座標112として格納される。
【0028】カラー画像の2値化をおこなうのではな
く、微分フィルタをかけ、すべての画素の近隣の画素と
のエッジ量を算出し、そのエッジ量を二値化することに
より得られた二値画像を同様に輪郭線追跡をして文字領
域を検出してもよい。
【0029】[文字領域に対する文字色抽出処理]一
方、文字色抽出部の一例のフローチャートを図19に示
す。二値画像は全面二値画像103を利用したがその限
りでなく、たとえば文字領域の座標とカラー画像のみ入
力し、カラー画像を改めて二値化した結果を利用して代
表色演算処理を行っても良い。
【0030】この図19の処理は文字領域検出部104
で文字と判定されたすべての領域に対して行われる。
【0031】(再二値化処理)まず、ステップS300
1で再二値化の判断を行う。
【0032】全面二値画像103は、すべての文字領域
が良好に二値化されたものとは限らない。二値画像が濃
すぎる場合も、薄すぎる場合も、共に結果の画質に悪影
響を及ぼすので、理想的には文字領域ごとに最適二値化
を行うのがよい。図5に示した全面のヒストグラムに比
べて、文字領域ごとの輝度ヒストグラムは、図9のよう
なシンプルな形が期待できるので、閾値の決定は容易で
ある。901は下地色の集合であり、902は文字色の
集合である。本実施の形態では処理時間を節約するた
め、より悪影響を及ぼす「濃すぎる二値画像」に対して
のみ再二値化を行う。
【0033】具体的には、文字領域検出部104におい
て、文字と判定された領域の二値画像を走査し、孤立点
フィルタとのパタンマッチングを行う。孤立点がその領
域中に閾値以上存在するか判定し、閾値以上の場合は、
その領域の輝度ヒストグラムをとり、最適閾値を算出し
て再二値化を行う。通常の文字領域であれば、部分的に
輝度ヒストグラムを通すことによってよりよい二値画像
が得られるが、まれに前よりも悪い結果(再二値化後、
前より濃い二値結果になる)場合が存在する。その現象
を防ぐために、再二値化では全面二値画像を得るのに使
用した二値化閾値を入力し、再二値化のための閾値と比
較して前よりも濃い結果が得られる場合は再二値化を行
わないなどの例外処理を設ける。
【0034】(文字切り処理)次にステップS3002
で、文字きり情報を作成する。
【0035】文字きり部では、文字領域が横書きである
か縦書きであるかによって処理が変わる。この横書きか
縦書きかの情報は文字領域検出部にて黒の固まりの並び
から判断され作成される。横書きである場合は、まず主
走査方向に二値画像の黒画素の射影を取る。そして行の
切れ目を検出した後、行ごとに副走査方向に黒画素の射
影を取り、1文字毎の情報を得る。縦書きである場合は
行きりだしが副走査方向に行われ文字きりだしが主走査
方向に行われる。この時、多少の画像の傾きにも耐えら
れるように、行きりだしの射影を取るのに行方向に3分
割して行うなどするとよい。この処理によって、各行の
座標情報、および各行に存在する文字の座標情報を得る
ことが出来る。
【0036】一方、文字判断処理(後述のステップS3
003)では、文字領域検出部にて文字と判定された領
域内の黒オブジェクトそれぞれを、さらに文字であるか
どうかを判定するためにも文字きり情報を利用する。具
体的には1文字の大きさや形から文字であるか否かを判
定する。画質、圧縮という点からかんがみると、単色、
または複数色に変換するのに「文字である」ことにこだ
わる必要はないのだが、(たとえば、単色で表現された
マークなどはJPEGで表現するより単色MMRで表現
したほうが画質圧縮率ともによいのだが)、確率の問題
として、文字以外の領域はグラデーションで表現されて
いることが多いからである。
【0037】(文字判断処理)次に、ステップS300
3で文字判断を行う。
【0038】ここでは、文字きり(S3002)での情
報を入力し、行ごとにその行の平均文字サイズを演算す
る。このとき極端に小さい文字の情報は無視するとより
よい結果が出る。その平均サイズよりも極端に大きい文
字矩形は文字でない、と判定する。また、平均に関わら
ず、縦横比情報などから明らかに文字でない形状の場合
は文字でない、と判定する。
【0039】その領域中にm文字存在する場合、m文字
すべてが文字でないという判定になった場合、文字判定
部はこの領域は画像である、という結果を出力する。
【0040】しかしながら、m文字中n文字(m>n,
n>=0)が文字でない、すなわち文字である矩形が
残っている場合は、二値画像上から文字でないと判定さ
れた黒オブジェクトを消去して、この領域は文字であ
る、という結果を出力する。
【0041】念の為最終画質をかんがみて、次の例外処
理を加える。たとえば領域中に10文字存在するときに
飛び飛びの5文字が文字として単色化され、残りが文字
でないとしてJPEG圧縮されると、「ムラ」な画像が
得られ、目視的に好ましくない画像となる。そこで、こ
の文字判断部にて、文字、画像の判断が頻繁に切り替わ
るようなケースには、その並びや文字と判断される矩形
の頻度などから全矩形文字にそろえる。または全矩形画
像にそろえる。
【0042】文字判断処理で、文字と判断された領域に
ついてはステップS3004に進み、文字でないと判断
された領域については、ステップS3005に進む。
【0043】(単色判断)ステップS3005では単色
判断を行う。
【0044】この処理を通る領域は文字領域検出部にて
文字と判定されたものの、文字判断にて文字でないと判
定された領域である。前述したように、文字であるか否
かにかかわらず、単色で表現されている領域であれば単
色化してMMRしたほうが、画質圧縮率ともによい。そ
こでこの領域は単色であるか否かの判断を行う。
【0045】具体例としては二値画像の黒部に値するカ
ラー画像の画素のRGBそれぞれのレベルのヒストグラ
ムを取りそれぞれのヒストグラムすべての分散値が閾値
以下であればこの領域は単色であると判定する。
【0046】単色である場合にはステップS3006の
1色抽出にすすみ、複数色である場合にはendにすす
む。
【0047】(一色抽出処理)ステップS3006での
1色抽出処理を図12のフローチャートを用いて説明す
る。
【0048】ステップS1201にてその文字座標が参
照する二値画像の細線化処理を行い、スキャナ読み込み
時の下地から文字部への変化部にあたる黒を減らしてい
き、新しい二値画像newbiを作成する。次にステッ
プS1202にてnewbiの黒画素に対応する原画像
のRGBのそれぞれの値のヒストグラムを取る(もちろ
ん、YUV等の他の色空間でも構わない)。ステップS
1203にてRGBそれぞれの代表値を算出する。例え
ば、一番大きな値でも良い。またはヒストグラムのステ
ップ数を少なくして大まかなヒストグラムで一番大きな
値を得た後に、このヒストグラムに存在する細かなヒス
トグラムで一番大きな値を得る方法でもよい。
【0049】後者のような方法を取ることにより、図1
3に示したようなヒストグラムからノイズ1302に惑
わされること無く真の代表値1301を得ることができ
る。図を使用して詳細に説明をすると、細かなヒストグ
ラムとしては例えば8ビットのRデータから256段階
のヒストグラム(図13に示す)が得られるわけだが、
これの最大値は1302になり、これは真の代表値では
ない。そこで、ヒストグラムをオーバーラップする64
の幅にわけ、8段階のものを256段階のヒストグラム
から再計算する。それを0から8に示したが、0と8は
32幅しかない。この再計算により代表値はに存在す
ることがわかり、内の最大値を検索して1301を得
ることができる。以上の処理をすべての文字座標に繰り
返すことにより、すべての文字座標に1つずつ代表色が
算出される。
【0050】(減色処理)ステップS3004では、文
字に対し、減色処理を行う。
【0051】減色処理部1082においては、文字部の
色について、元原稿が単色で表現されていた場合におい
ても、スキャナ読み取り時に下地から文字部への色の遷
移部が存在する。
【0052】図22,図25にスキャナ読み取りによる
色の遷移の様子を示す。図22では簡単のため、RGB
で説明せず、Rのみで説明する。Aという文字はもとも
とR=32レベルの単色にて構成されていたものである
が、スキャナにより読み込むと、そのデータは拡大の画
素で示すようにばらついてしまう。もともとのレベルR
=32近くの黒まで達している画素は3201, 32
02, 3203の3つだけに過ぎず、他の画素は、下
地色(この場合白)とR=32の間のレベルにとどまる
結果、遷移部であるグラデーションで文字が表現されて
いる。図25では図22の文字Aの画素レベルの3次元
ヒストグラムにて色の遷移の様子を示す。下地色が35
01に示す白であり、文字色が3502に示す黒である
とする。遷移部を3503に示す。
【0053】元々単色で表現されていた文字部のスキャ
ナ読み込みによるバラツキである遷移部を厳密に表現す
る必要はない。その代表色のみで表現することが出来れ
ば画質もよく、データ量も少なくてすむ。しかしなが
ら、二値画像の細線化などを行ったとしても、この下地
から文字部の遷移部の色を完全に除去することは難し
い。そこで、1文字は単色であらわされることが多いこ
とを利用して、文字きり情報を使い、1文字1色に限定
することにより画質、圧縮率の向上を目指す。ただし、
もともとからグラデーションで表現される文字などを更
に高画質で圧縮したい場合には、その文字が複数色で表
現されているかの判定など例外処理を加えればよい。即
ち、このように文字切り情報を利用して1文字1色にす
れば、元々単色で表現されていた文字画像のスキャナ読
み込みによるバラツキとして発生する遷移部を除去する
事ができる。
【0054】次に減色処理部の詳細説明を図20のフロ
ーチャートを利用して行う。
【0055】ステップS3101にてその文字座標が参
照する二値画像の細線化処理を行い、スキャナ読み込み
時の下地から文字部への遷移部にあたる黒を減らしてい
き、新しい画像thinimageを作成する。thi
nimageは二値画像であるが、後述のステップS3
110の処理にて使用するので255(黒)と0(白)
の二値として8ビットで構成する。次にステップS31
02にてthinimageの黒画素に対応する原画像
のRGBの3次元ヒストグラムを取る。この際、普通に
ヒストグラムをとると、たとえば入力画像がRGB各8
ビットだとすると、256×256×256のヒストグ
ラムが必要になる。文字部に必要なのは解像度であり、
階調は必要ないこと、また、スキャナによる読み込み時
のばらつきを押さえながら代表色を算出するには多少の
画素値の違いは無視した方が良いこと、などをかんがみ
ると、これほどの細かなヒストグラムは必要ない。たと
えば、したがってこの例では、上位5ビットのRGB3
次元ヒストグラムをとる。このヒストグラムをとる際
は、その文字領域に存在する黒画素の総数blackn
umも算出する。
【0056】本実施の形態ではRGB空間を利用した
が、LabやYUVなどの他の色空間でも構わない。ま
た、3次元ヒストグラムをとったが、各色それぞれの1
次元ヒストグラムを3つとってもかまわない。
【0057】ステップS3103にてその領域に存在す
る文字色数を示すcolnumを0にリセットする、処
理済の画素数を示すokpixelを0にリセットする
などの初期化作業を行う。
【0058】ステップS3104にて代表値を算出す
る。ここでは、注目ヒストグラムを中心とする7つのヒ
ストグラムの合計値が最大な点を代表値とする。(7つ
のヒストグラム:注目点と、R次元で隣り合った2つ、
G次元で隣り合った2つ、B次元で隣り合った2つ(図
15に示す))このように検出された最大値をcolR
[colnum]:, colG[colnum],
colB[colnum]に代入する。
【0059】次にステップS3105にてこの代表値を
中心としたこの代表値に変換されるべき色の範囲を決定
する。
【0060】代表値をそれぞれ固定して3つの1次元ヒ
ストグラムを得る。図23にその様子を示す。例えば、
代表値を(Col R(26),ColG(30),C
olB(22) )と仮定すると3次元ヒストグラムの
Gを30、Bを22に固定したRの1次元ヒストグラム
(=全ヒストグラムを3301の線に射影)、3次元ヒ
ストグラムのRを26、Bを22に固定したGの1次元
ヒストグラム(=全ヒストグラムを3302の線に射
影)、3次元ヒストグラムのRを26、Gを30に固定
したBの1次元ヒストグラム(=全ヒストグラムを33
03の線に射影)を得る。例えばRの1次元ヒストグラ
ムは図24のような形になるがこれの3401の点、3
402の点を検出しそれを代表値に題する「Rの範囲」
とする。検出の方法としては、画像の二値化閾値決定方
法を利用する方法などがある。例えば3403は代表値
であるが、0から代表値までのヒストグラムを二値化閾
値決定関数に代入する事により3401の点を得て、代
表値から31までのヒストグラムを反転したものを二値
化閾値決定関数に代入する事により3402の点を得る
事が出来る。
【0061】この色の範囲をR,G,Bそれぞれ決定し
fg_range[colnum]に代入する。
【0062】ステップS3106にてfg_range
[colnum]内の3次元ヒストグラムの値をすべて
0にする。この時、0にした画素の数を処理済の画素数
を示すokpixelに加算する。
【0063】ステップS3107にて近似色判定を行
う。近似色判定は、fg_color[colnum]
に対して、それまでに出現した色すべて(fg_col
or[0]からfg_color[colnum−1]
まで)に対して行う。ただし、近似色が見つかった場合
はループを抜ける。文字きりの説明にて言及したように
スキャナにより読み取った画像は下地色と文字色の間に
遷移的な色が発生してしまう。図25に示すように下地
色(3501)と文字色(3502)の間の色の画素
(3503)が存在してしまうのである。二値画像を参
照する事により、3504にあらわした線より下地色側
の色は3次元ヒストグラムに加算されない。(また二値
画像の細線化により3504の線はより文字色側によ
る)しかしながらなお遷移部分は存在していて、350
2の文字色抽出後に遷移部分の色を抽出してしまうこと
がある。例えば、fg_color[0]が(32,
40,40)なのに対して、fg_color[m]に
(96, 112, 96)を取り出してしまう事がよ
くある。これを同じ文字色だと判断するために近似色判
定を行う。均等色空間でないRGB空間では近似色判定
がやや難しいので、ここでは、Lab空間にて判定す
る。fg_color[0]=(32,40, 40)
をLab変換すると(15, −4, −1)であり、
fg_color[m]=96, 112, 96)
のLab変換は(45, −9, 7)である。
【0064】これにより、元々単色で表現されていた文
字画像のスキャナ読み込みによるバラツキとして発生す
る遷移部を除去する事ができ、高画質高圧縮の画像圧縮
を可能とする。
【0065】本来下地色も検出し、下地色とfg_co
lor[0]の延長線に存在する色を近似色とするべき
であるが、今回は下地は白が多いと割きり、Labのa
bの距離が閾値以下であったら近似色であると判定す
る。判定結果は、kinji[]行列に残す。kinj
i[]にて同じ数字を持つものは近似色であることを表
す。
【0066】例を以下にしめす。kinji[0]とk
inji[3]はともに0である。すなわち、fg_c
olor[0]とfg_color[3]は近似色であ
るということである。
【0067】 fg_color[0] = (32, 40, 40) kinji [0] = 0 fg_color[1] = (248, 64, 48) kinji [1] = 1 fg_color[2] = (48, 256, 32) kinji [2] = 2 fg_color[3] = (96, 112, 96) kinji [3] = 0 ステップS3108てcolnumをインクリメントす
る。
【0068】ステップS3109にて色抽出済みの黒画
素が75%以上超えたかどうか判定する(75は一
例)。
【0069】すなわちokpixel×75 >bla
cknum×100を満たすかどうかチェックする。
【0070】超えていたらステップS3110にすすみ
超えていないときはステップS3113にすすむ。
【0071】ステップS3110ではthinimag
e上にパレット画像を構築する。具体的にはthini
mageの値が255の画素(まだ色割り当てが行われ
ていないことを示す)に対応するカラー画像の画素RG
Bレベルを参照し、そのRGBデータがfg_rang
e[m]内に存在する場合はkinji[m]+1の値
(すなわち1)をthinimageの対応する画素値
に当てはめる。ここで、kinji[m]でなくkin
ji[m]+1を代入するのは、0が文字部でない(下
地)ことをあらわす特別な数字であるためkinji
[m]が0の時そのまま代入できないからである。
【0072】ステップS3110にてthinimag
e上にパレット画像を作成すると、次にステップS31
11にて文字きり情報を利用して、パレット画像から文
字毎の色情報charpalを作成する。
【0073】ここで、文字切り単位毎の色情報char
palの作成方法について、図26の文字画像を例にし
て説明する。この文字の「明日は晴れです。昨日は雨で
した。」の「晴れ」はfg_color[1]で抽出さ
れた赤色、「雨」がfg_color[2]で検出され
た青色であり、その他は黒であるとする。
【0074】文字きり処理により、1文字目の「明」が
最初の1文字として処理される。この文字に存在する細
線画像thinimageの黒画素数は100個とす
る。そのうち70個がfg_range[0]内に存在
し、20個がfg_range[3]内に存在したとす
る。kinji[0]もkinji[3]もともに0
(近似色である)であるので、90画素ともにステップ
S3110にて1が割り当てられる。ここでは、存在す
る黒画素の最大数を1つの数字が占めたらその色を割り
当てることにする。このケースでは、まだ色が割り当て
られない画素は残り10画素であり、この10画素が全
てこれから検出される色だったとしても90を超えるこ
とはない。そこで、「明」の色情報charpal
[0]は1とする。
【0075】このように各文字切り部分について、その
文字に割り当てる色を0〜2の3つのcharpalか
ら選択する。その結果、「晴れ」の左辺「日」右辺
「青」「れ」は赤であるkinji[1]+1=2,
「雨」は青であるkinji[2]+1=3が割り当て
られ、残りの文字は黒であるkinji[0]+1=1
がcharpalとして割り当てられる。
【0076】この例では、存在する文字数20文字のす
べてに対応するcharpalに色情報が割り当てられ
たので、ステップS3113の条件にて文字色抽出ルー
プを抜ける条件に当てはまり、ステップS3114に飛
ぶ。しかし、ここでたとえば20文字中18文字しか当
てはまらなかった場合、ステップS3112にてcha
rpalが作成されない文字のみの3次元ヒストグラム
を取り直してステップS3105に戻る。この際bla
cknumもcharpal未作成の文字の細線黒画素
数が代入され、okpixelは0にリセットされる。
そして上記の例でいうと、fg_color[3]まで
検出されているのでfg_color[4]から同様に
抽出を行う。
【0077】この時、高速化のため3次元ヒストグラム
取り直しステップS3112は一度限りとし、ステップ
S3110、ステップS3111は2度までと限定して
もよい。実験によるとそれで十分な画質が得られてい
る。
【0078】上記の限定を入れた場合、ステップS31
13にてループを抜けてもcharpalが未作成の文
字がありえる。そこで、ステップS3114において、
charpal未作成の文字数nokoricharが
1以上の時、強制的に未作成charpalに色情報を
割り当てる。具体的には、ステップS3111の割り当
てではthinimageの画素値が255の画素(す
なわちまだ色抽出が行われていない画素)のその後の動
向も考えて、最大値が得られた場合のみにcharpa
lに色情報を代入した。しかしステップS3114にお
いてはthinimageの255の画素は無視して残
りの0(下地)以外の画素の最大値でcharpalを
決定する。ただし、0(下地)以外の画素がすべて25
5のケースもある(1画素も色抽出が行われなかっ
た)。その場合には、位置的に近い文字のcharpa
lの色を代入する。たとえば、図26の「す」がそのケ
ースの場合に、位置的に近い「で」のcharpalを
代入する。
【0079】ここまでで抽出した色数としてcolnu
mという数値が選られている。しかし、これは近似色も
含めているし、抽出したものの使用しない色もありえる
ので、実際に使用されている色数(usecolnu
m)とは異なる。そこで、ステップS3115にてch
arpalをなめて実際に使用されている色数を計算す
る。
【0080】ステップS3116ではステップS311
5にて計算されたusecolnumが16以上の時は
下地(0)とあわせて17色存在することになり、4ビ
ットであらわせないので、ステップS3117に進み、
この領域の減色処理はあきらめてDOJPEGを返す
(下地画像として表現する)。ただし、ここで4ビット
でなく8ビットまで許した場合は16でなく256にな
る。
【0081】usecolnumが1の場合は、ステッ
プS3118に進み、使用色1色のパレットを作成し、
ステップS3119にて入力二値画像の切抜きをおこな
い、ステップS3120にてDOMMRを返す。
【0082】usecolnumが2以上16未満の場
合は、ステップS3121に進み、使用色のパレットを
作成し、ステップS3122にてパレット画像を作成す
る。ここでは、2,3のケースでは、1画素2ビットに
て表されるパレットを、4以上16未満のケースでは1
画素4ビットにて表されるパレットを作成する。そして
ステップS3123にてDOZIPを返す。
【0083】このようにして作成された減色画像109
が1ビットの場合(文字色抽出によりDOMMRが返さ
れた場合)は110にてMMR圧縮し、圧縮コードYを
作成する。また、減色画像109が2ビット以上の場合
(文字色抽出によりDOZIPが返された場合)は11
1にてZIP圧縮し、圧縮コードZを作成する。DOJ
PEGが返された場合は減色画像が存在しないMMR圧
縮部110やZIP圧縮部111には送らず、文字部塗
りつぶし部105に文字領域として扱わないようにコマ
ンドを送る。
【0084】[文字塗りつぶし処理]文字部塗りつぶし
部104の処理の一例を図10と図11を用いて説明す
る。図11は、文字部塗りつぶし処理の流れを示すフロ
ーチャートである。
【0085】一例として、グラデーション画像を背景と
し、ABCという青色の文字が中央付近に描かれた、図
10(a)のような画像を原画像とする。この原画像か
ら(b)のような1つの文字領域の2値画像を得たとす
る。そして、文字部塗りつぶし処理として、まず、ステ
ップS1101で、全画像を32×32の領域(以下、
パーツ)に分割し、パーツごとに処理をおこなう。図1
0(c)にパーツごとに分けた様子を示す。この図では
簡単に説明するため、5×5のパーツに分割した状態を
示している。各領域の左上の数字はパーツ番号を示す。
この領域分割の個数はこれに限るものではなく、他の数
でもよい。
【0086】ステップS1102では未処理のパーツか
否か判断し、未処理のパーツについては、ステップS1
103に進んで文字塗りつぶし対象領域がそのパーツ内
に存在するか否か判断される。文字領域検出部104で
文字領域と判定された領域でも、文字色抽出部108で
DOJPEGが返された領域は、文字部塗りつぶしの対
象領域とはしない。
【0087】図10(c)の例では、パーツ00〜0
4,10,14,20,24,30〜35は、ステップ
S1103において文字塗りつぶし対象領域がないと判
断され、処理は行われずに、次のパーツに進む。文字塗
りつぶし対象領域の存在するパーツ(例えばパーツ1
1)に対しては、ステップS1104に進み、対応する
二値画像を参照し、二値画像の白部分に対応するカラー
画像のRGB値(またはYUV等でも良い)の平均値a
ve_colorを算出する。次にステップS1105
において、対応する二値画像を参照し、黒画素に対応す
る画素の濃度データをave_colorとする。以上
の処理を文字塗りつぶし対象領域の存在するパーツ(こ
こでは、パーツ12,13,21,22,23)に繰り
返す。このようにして、文字の存在した部分に周りの画
素の平均値を埋めることができる。
【0088】この画像を縮小部106にて縮小する。本
実施の形態では単純間引きとする。ちなみに、この縮小
と文字部塗りつぶし処理は順番を逆にしても構わない。
その場合二値画像とカラー画像の位置のずれを気を付け
る必要がある。
【0089】文字領域座標112、パレット114、圧
縮コードX(113)、圧縮コードY(115)、圧縮
コードZ(116)の5つをまとめたフォーマットを必
要ならば作成する。5つをまとめるフォーマットの一例
としてAdobe(商標)のPDFなどが考えられる。
AdobeのPDFとはAdobeが無償配布している
Acrobat Reader(商標)というアプリケ
ーションで表示できるフォーマットであり、ドキュメン
トを作成したアプリケーションがないために、受け手側
でファイルを開けないなどのトラブルを避けることが出
来る。その他のフォーマットとしては、XMLなどがあ
る。XMLとはネットワークを介して文書やデータを交
換したり配布したりするための記述言語である。
【0090】[伸長処理]図2に伸長処理を行うために
必要な構成を示す図である。
【0091】201は圧縮コードX(113)を入力
し、JPEG伸長処理をおこない多値画像Eを作成する
JPEG伸長部である。202は多値画像Eを入力し、
拡大処理を行う拡大部である。203は拡大部202に
より拡大された多値画像Fである。204は圧縮コード
Y(115)を入力し二値画像G(205)を作成する
MMR伸長部である。206は圧縮コードZ(116)
を入力し多色画像H(207)を作成するIP伸長部で
ある。208は文字領域座標112とそれに対応するパ
レット114および二値画像G(205)または多色画
像H(207)を入力し、二値画像または多色画像の画
素データが透過をあらわす場合は画像F(203)の画
素の色を、それ以外のときは対応するパレット色を選択
し最終的な画像である画像I(209)を作成する画像
合体部である。
【0092】図14に合体処理208の結果例を示す。
まず図14(a)に圧縮コードCのJPEG伸長結果を
示す。これは、図10の画像を利用したが、JPEG圧
縮の量子化非可逆方式を利用すると図10(c)とは微
妙に画素値が異なるデータとなっている。しかし、文字
部を抜く前の原画像をJPEG非可逆圧縮方式で圧縮す
る場合と比較して、同じ量子化テーブルを利用した場合
において画素値の変化は少ない。すなわち高画質であ
る。本例では合体処理を行う文字領域画像はMMR圧縮
された二値画像とする。伸長された二値画像を(b)に
示す。そのパレットはR=20 G=30, B=22
5とする。二値画像(b)を参照して黒画素の対応する
ところの画像(a)上にパレット色(20,30,25
5)データをのせ、最終的に(c)のような画像が出来
上がる。多色画像の場合はパレット数が変わり、たとえ
ば2ビットなら00,01, 10, 11の4つの画
素値に割り当てられたパレットを当てはめていく。その
うち1つは透過を示し、たとえば00とすると、00の
値をもつ画素は画像(a)の画素を選択する。
【0093】01の時は01のパレット値、10の時は
10のパレット値、11のときは11のパレット値をの
せる。このようにして伸長画像209が作成される。
【0094】<他の実施形態>上記実施の形態では二値
画像は全面単一閾値にて作成したがその限りでなく、た
とえば、文字領域検出104により検出された文字領域
ごとに最適閾値を演算して二値画像を作成してもよい。
その場合、図19のステップS3001の再二値化判断
が必要なくなる。
【0095】また、文字部塗りつぶし、105、文字色
抽出108にて同じ二値画像を使用したが、その限りで
なくそれぞれに最適な二値化部を105,108内部に
て所有してもかまわない。
【0096】また、上記実施形態では、輝度の低い下地
上の輝度の高い文字(反転文字)の処理が不可能である
が、たとえば図16に示す構成にすれば可能となる。1
702は微分処理部であり、図17に示すような微分フ
ィルタを注目画素を中心にかけ、その絶対値が閾値を超
えたら黒、超えなかったが白というように二値化してい
く。図17(a)は1次微分フィルタであり、上は横線
を検出することができ、下は縦線を検出することができ
る。2つのフィルタの絶対値の合計を利用すると斜め線
を検出することができる。また、斜め線フィルタを利用
してもよい、図17(b)は二次微分フィルタで全方向
に対応したものである。二次微分フィルタも横方向、縦
方向、と作成することも可能である。このようなフィル
タを全画素にかけ、微分画像1702を作成する。この
時、全画素でなく、間引きながらフィルタをかけること
によって同時に解像度も落とすことも可能である。以上
のように作成された二値画像に図3の304からの処理
を行えば反転文字も含んだ文字領域座標も検出すること
ができる。また、反転文字も対象にした場合は二値化部
1703も対応しなければならない。反転文字領域も文
字領域として抽出された場合、上記実施の形態では図9
のパターンしか入ってこないと想定していたが、図18
の3パターンが主に入ってくることになる。(b)が反
転文字であり、(c)が同一のグレー下地上に黒文字と
白文字の2色が存在するケースである。これらの3パタ
ンを考えて、二値化部1703では、A点とB点を検出
し、AとBにはさまれた領域は白、その他は黒の二値化
処理をおこなうとよい。または、(c)のケースはかん
がえずに下地と文字部を分ける1つの閾値を検出し、反
転パタンであれば反転する処理を行えばよい。このよう
に反転文字領域も対応すればJPEG圧縮される画像上
には実施の形態1では残ってしまっていた反転文字領域
も文字部塗りつぶしによりスムージングされるので、圧
縮効率もよく、またその反転文字部も解像度やモスキー
トノイズの劣化なしに圧縮することが可能となる。
【0097】なお、本発明は、複数の機器(例えばホス
トコンピュータ、インタフェイス機器、リーダ、プリン
タなど)から構成されるシステムに適用しても、一つの
機器からなる装置(例えば、複写機、ファクシミリ装置
など)に適用してもよい。
【0098】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体(または記録媒体)を、システムあるい
は装置に供給し、そのシステムあるいは装置のコンピュ
ータ(またはCPUやMPU)が記憶媒体に格納された
プログラムコードを読み出し実行することによっても、
達成されることは言うまでもない。この場合、記憶媒体
から読み出されたプログラムコード自体が前述した実施
形態の機能を実現することになり、そのプログラムコー
ドを記憶した記憶媒体は本発明を構成することになる。
また、コンピュータが読み出したプログラムコードを実
行することにより、前述した実施形態の機能が実現され
るだけでなく、そのプログラムコードの指示に基づき、
コンピュータ上で稼働しているオペレーティングシステ
ム(OS)などが実際の処理の一部または全部を行い、
その処理によって前述した実施形態の機能が実現される
場合も含まれることは言うまでもない。
【0099】さらに、記憶媒体から読み出されたプログ
ラムコードが、コンピュータに挿入された機能拡張カー
ドやコンピュータに接続された機能拡張ユニットに備わ
るメモリに書込まれた後、そのプログラムコードの指示
に基づき、その機能拡張カードや機能拡張ユニットに備
わるCPUなどが実際の処理の一部または全部を行い、
その処理によって前述した実施形態の機能が実現される
場合も含まれることは言うまでもない。
【0100】本発明を上記記憶媒体に適用する場合、そ
の記憶媒体には、先に説明した(図19および/または
図20、21に示す)フローチャートに対応するプログ
ラムコードが格納されることになる。
【0101】
【発明の効果】本発明によれば、文字切り単位毎に1色
の色を割り当てるため、文字を効率的に複数色で表すこ
とができ、圧縮システムに利用すると、高画質高圧縮の
画像圧縮を可能とする。
【図面の簡単な説明】
【図1】図1は本発明の一実施形態に係る画像処理装置
の構成を示す図である。
【図2】図2は本発明の一実施形態に係る画像処理装置
で圧縮したデータを伸長するための構成を示す図であ
る。
【図3】図3は本発明の一実施形態に係る文字領域検出
処理の一例のフローチャートである。
【図4】図4は本発明の一実施形態に係る文字領域検出
処理を説明する図である。
【図5】図5は本発明の一実施形態に係る文字領域検出
処理を説明する図である。
【図6】図6は本発明の一実施形態に係る文字領域検出
処理を説明する図である。
【図7】図7は本発明の一実施形態に係る文字領域検出
処理を説明する図である。
【図8】図8は本発明の一実施形態に係る文字領域検出
処理を説明する図である。
【図9】図9は本発明の一実施形態に係る文字領域の再
2値化処理を説明する図である。
【図10】図10は本発明の一実施形態に係る文字塗り
つぶし処理を説明する図である。
【図11】図11は本発明の一実施形態に係る文字塗り
つぶし処理を説明するフローチャートである。
【図12】図12は本発明の一実施形態に係る1色抽出
処理を説明するフローチャートである。
【図13】図13は本発明の一実施形態に係る1色抽出
処理を説明する図である。
【図14】図14は本発明の一実施の形態に係る画像処
理装置で圧縮したデータを伸長し、合体する様子を説明
する図である。
【図15】図15は本発明の一実施の形態に係る減色処
理を説明する図である。
【図16】図16は本発明の他の実施形態に係る画像処
理装置の構成を示す図である。
【図17】図17は本発明の他の実施形態に係る画像圧
縮処理を説明する図である。
【図18】図18は本発明の他の実施形態に係る文字領
域の2値化処理を説明する図である。
【図19】図19は本発明の一実施の形態に係る文字色
抽出処理を示すフローチャートである。
【図20】図20は本発明の一実施の形態に係る減色処
理を示すフローチャートである。
【図21】図21は本発明の一実施の形態に係る減色処
理を示すフローチャートである。
【図22】図22はスキャナにより発生する文字部の遷
移部(グラデーション)を説明する図である。
【図23】図23は本発明の一実施の形態に係る減色処
理を説明するための図である。
【図24】図24は本発明の一実施の形態に係る減色処
理を説明するための図である。
【図25】図25はスキャナにより発生する文字部の遷
移部(グラデーション)を3次元ヒストグラムで表した
図である。
【図26】図26は本発明の一実施の形態に係る、文字
きり情報を利用して文字の色を決定する色割当て処理を
説明する図である。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04N 1/46 Z Fターム(参考) 5B057 AA11 BA30 CA01 CA08 CA12 CA16 CB01 CB06 CB08 CB12 CB18 CB19 CC03 CE12 CE17 CG02 CG03 CG04 DA06 DA17 DB02 DB05 DB06 DB08 DB09 DC14 DC17 DC19 DC23 DC25 5C077 LL17 MP05 MP08 PP27 PP28 PP32 PP37 PQ08 PQ12 PQ19 RR02 RR15 RR21 SS01 5C079 HB01 LA02 LA06 LA27 LA31 LB11 MA11 NA10 5L096 AA02 AA06 BA17 EA04 EA43 FA06 FA35 FA37 FA44 GA34 GA40 GA51

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】カラー画像データを2値化する2値化手段
    と、 前記カラー画像データから文字領域を検出する検出手段
    と、 前記文字領域中の文字を構成するN個の色から、N以下
    のM個の色を導き出す減色手段と、 前記文字領域に対し文字きり処理を行う文字きり手段
    と、 前記文字きり手段により得られた文字きり単位毎に、前
    記M個の色の内、1色を割り当てる色割当て手段と、 を有することを特徴とする画像処理装置。
  2. 【請求項2】前記色割当て手段は、前記文字切り単位中
    の文字を構成する複数画素の中で、最も多い画素数を占
    める色を、前記M個の色から選択し、前記文字切り単位
    中の文字を構成する全画素に割り当てることを特徴とす
    る請求項1に記載の画像処理装置。
  3. 【請求項3】前記減色手段は、前記カラー画像データの
    前記文字領域のRGB3次元ヒストグラムを用いて代表
    色を抽出する抽出手段を含むことを特徴とする請求項1
    に記載の画像処理装置。
  4. 【請求項4】前記減色手段は、前記抽出手段によって抽
    出された前記代表色のうち、1の代表色が下地色から他
    の代表色への遷移的な色であるか否か判定し、遷移的な
    色の場合には、前記他の代表色と同色として扱うことに
    より、前記M個の色を導き出すことを特徴とする請求項
    3に記載の画像処理装置。
  5. 【請求項5】前記色割当て手段によって前記文字領域に
    割当てられた色の総数に応じて、異なる方法で圧縮する
    圧縮手段を更に有することを特徴とする請求項1乃至4
    のいずれかに記載の画像処理装置。
  6. 【請求項6】前記圧縮手段は、前記文字領域に割り当て
    られる色が1色の場合には、その文字領域に対してMM
    R圧縮を行い、前記文字領域に割当てられる色が2色以
    上、所定数S色未満の場合には、その文字領域に対して
    ZIP圧縮を行い、前記文字領域に割り当てられる色が
    S色以上の場合には、JPEG圧縮を行うことを特徴と
    する請求項5に記載の画像処理装置。
  7. 【請求項7】カラー画像データを2値化する2値化工程
    と、 前記カラー画像データから文字領域を検出する検出工程
    と、 前記文字領域中の文字を構成するN個の色から、N以下
    のM個の色を導き出す減色工程と、 前記文字領域に対し文字きり処理を行う文字きり工程
    と、 前記文字きり工程により得られた文字きり単位毎に、前
    記M個の色の内、1色を割り当てる色割当て工程と、を
    有することを特徴とする画像処理方法。
  8. 【請求項8】コンピュータに、 カラー画像データを2値化する2値化工程と、 前記カラー画像データから文字領域を検出する検出工程
    と、 前記文字領域中の文字を構成するN個の色から、N以下
    のM個の色を導き出す減色工程と、 前記文字領域に対し文字きり処理を行う文字きり工程
    と、 前記文字きり工程により得られた文字きり単位毎に、前
    記M個の色の内、1色を割り当てる色割当て工程と、 を実行させるためのプログラム。
  9. 【請求項9】コンピュータに、 カラー画像データを2値化する2値化工程と、 前記カラー画像データから文字領域を検出する検出工程
    と、 前記文字領域中の文字を構成するN個の色から、N以下
    のM個の色を導き出す減色工程と、 前記文字領域に対し文字きり処理を行う文字きり工程
    と、 前記文字きり工程により得られた文字きり単位毎に、前
    記M個の色の内、1色を割り当てる色割当て工程と、 を実行させるためのプログラムを格納した記憶媒体。
JP2001193640A 2000-07-12 2001-06-26 画像処理装置、画像処理方法、プログラム並びに記憶媒体 Expired - Lifetime JP3715905B2 (ja)

Priority Applications (8)

Application Number Priority Date Filing Date Title
JP2001193640A JP3715905B2 (ja) 2001-06-26 2001-06-26 画像処理装置、画像処理方法、プログラム並びに記憶媒体
EP01305987A EP1173003B1 (en) 2000-07-12 2001-07-11 Image processing method and image processing apparatus
DE60138073T DE60138073D1 (de) 2000-07-12 2001-07-11 Bildverarbeitungsverfahren und Bildverarbeitungsvorrichtung
US09/902,172 US6999619B2 (en) 2000-07-12 2001-07-11 Processing for accurate reproduction of symbols and other high-frequency areas in a color image
CNB200510054267XA CN100348014C (zh) 2000-07-12 2001-07-12 图像处理装置、图像处理方法
CNB011325208A CN1201266C (zh) 2000-07-12 2001-07-12 图像处理装置和图像处理方法
US11/246,301 US7221790B2 (en) 2000-07-12 2005-10-11 Processing for accurate reproduction of symbols and other high-frequency areas in a color image
US11/678,914 US7376267B2 (en) 2000-07-12 2007-02-26 Image processing apparatus, image processing method, and program and storage medium therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001193640A JP3715905B2 (ja) 2001-06-26 2001-06-26 画像処理装置、画像処理方法、プログラム並びに記憶媒体

Publications (2)

Publication Number Publication Date
JP2003008909A true JP2003008909A (ja) 2003-01-10
JP3715905B2 JP3715905B2 (ja) 2005-11-16

Family

ID=19031889

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001193640A Expired - Lifetime JP3715905B2 (ja) 2000-07-12 2001-06-26 画像処理装置、画像処理方法、プログラム並びに記憶媒体

Country Status (1)

Country Link
JP (1) JP3715905B2 (ja)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005079803A (ja) * 2003-08-29 2005-03-24 Kyocera Mita Corp 画像形成装置
JP2005175643A (ja) * 2003-12-08 2005-06-30 Fuji Xerox Co Ltd 画像処理装置
JP2005236697A (ja) * 2004-02-19 2005-09-02 Fuji Xerox Co Ltd 画像処理装置
JP2005260452A (ja) * 2004-03-10 2005-09-22 Fuji Xerox Co Ltd 画像処理装置
JP2007336563A (ja) * 2006-06-15 2007-12-27 Sharp Corp デジタル画像における均一な色の領域を特定する方法およびシステム
JP2009251902A (ja) * 2008-04-04 2009-10-29 Sony Corp 画像処理装置と画像処理方法および撮像装置
JP2011023951A (ja) * 2009-07-15 2011-02-03 Fuji Xerox Co Ltd 画像処理装置および画像処理プログラム
JP2011199352A (ja) * 2010-03-17 2011-10-06 Kyocera Mita Corp 画像処理装置,画像形成装置
US8144241B2 (en) 2008-04-04 2012-03-27 Sony Corporation Imaging apparatus, image processing apparatus, and exposure control method
US8150166B2 (en) 2006-09-06 2012-04-03 Sharp Laboratories Of America, Inc. Methods and systems for identifying text in digital images
US8368956B2 (en) 2006-06-15 2013-02-05 Sharp Laboratories Of America, Inc. Methods and systems for segmenting a digital image into regions
US8630498B2 (en) 2006-03-02 2014-01-14 Sharp Laboratories Of America, Inc. Methods and systems for detecting pictorial regions in digital images
JP2018157379A (ja) * 2017-03-17 2018-10-04 ブラザー工業株式会社 画像処理装置、および、コンピュータプログラム
CN110888611A (zh) * 2018-09-10 2020-03-17 佳能株式会社 图像处理装置和图像处理方法以及存储介质
JP2021040348A (ja) * 2020-12-08 2021-03-11 ブラザー工業株式会社 画像処理装置、および、コンピュータプログラム
US11082581B2 (en) 2018-10-26 2021-08-03 Canon Kabushiki Kaisha Image processing apparatus and method for control to smooth a character region of a binary image and perform character recognition

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005079803A (ja) * 2003-08-29 2005-03-24 Kyocera Mita Corp 画像形成装置
JP2005175643A (ja) * 2003-12-08 2005-06-30 Fuji Xerox Co Ltd 画像処理装置
JP2005236697A (ja) * 2004-02-19 2005-09-02 Fuji Xerox Co Ltd 画像処理装置
JP2005260452A (ja) * 2004-03-10 2005-09-22 Fuji Xerox Co Ltd 画像処理装置
US8630498B2 (en) 2006-03-02 2014-01-14 Sharp Laboratories Of America, Inc. Methods and systems for detecting pictorial regions in digital images
JP2007336563A (ja) * 2006-06-15 2007-12-27 Sharp Corp デジタル画像における均一な色の領域を特定する方法およびシステム
JP4745297B2 (ja) * 2006-06-15 2011-08-10 シャープ株式会社 デジタル画像における均一な色の領域を特定する方法およびシステム
US8437054B2 (en) 2006-06-15 2013-05-07 Sharp Laboratories Of America, Inc. Methods and systems for identifying regions of substantially uniform color in a digital image
US8368956B2 (en) 2006-06-15 2013-02-05 Sharp Laboratories Of America, Inc. Methods and systems for segmenting a digital image into regions
US8150166B2 (en) 2006-09-06 2012-04-03 Sharp Laboratories Of America, Inc. Methods and systems for identifying text in digital images
JP2009251902A (ja) * 2008-04-04 2009-10-29 Sony Corp 画像処理装置と画像処理方法および撮像装置
US8144241B2 (en) 2008-04-04 2012-03-27 Sony Corporation Imaging apparatus, image processing apparatus, and exposure control method
JP2011023951A (ja) * 2009-07-15 2011-02-03 Fuji Xerox Co Ltd 画像処理装置および画像処理プログラム
JP2011199352A (ja) * 2010-03-17 2011-10-06 Kyocera Mita Corp 画像処理装置,画像形成装置
US8547612B2 (en) 2010-03-17 2013-10-01 Kyocera Document Solutions Inc. Image processing apparatus, image forming apparatus, and image processing method that read color image data from a document
JP2018157379A (ja) * 2017-03-17 2018-10-04 ブラザー工業株式会社 画像処理装置、および、コンピュータプログラム
CN110888611A (zh) * 2018-09-10 2020-03-17 佳能株式会社 图像处理装置和图像处理方法以及存储介质
JP2020043461A (ja) * 2018-09-10 2020-03-19 キヤノン株式会社 画像処理装置と画像処理方法、及びプログラム
US11283963B2 (en) 2018-09-10 2022-03-22 Canon Kabushiki Kaisha Image processing apparatus and image processing method and storage medium
US11082581B2 (en) 2018-10-26 2021-08-03 Canon Kabushiki Kaisha Image processing apparatus and method for control to smooth a character region of a binary image and perform character recognition
JP2021040348A (ja) * 2020-12-08 2021-03-11 ブラザー工業株式会社 画像処理装置、および、コンピュータプログラム

Also Published As

Publication number Publication date
JP3715905B2 (ja) 2005-11-16

Similar Documents

Publication Publication Date Title
US7376267B2 (en) Image processing apparatus, image processing method, and program and storage medium therefor
US6307962B1 (en) Document data compression system which automatically segments documents and generates compressed smart documents therefrom
US7133565B2 (en) Image processing apparatus and method
EP0652538B1 (en) Image processing apparatus and method
EP0522702B1 (en) Spot color extraction
US8417029B2 (en) Image processing apparatus and method, including fill-up processing
JP5132530B2 (ja) 画像符号化装置及び画像処理装置及びそれらの制御方法
US8244035B2 (en) Image processing apparatus and control method thereof
JP4366003B2 (ja) 画像処理装置及び画像処理方法
JP3715905B2 (ja) 画像処理装置、画像処理方法、プログラム並びに記憶媒体
US8395813B2 (en) Subtractive color method, subtractive color processing apparatus, image forming apparatus, and computer-readable storage medium for computer program
JP2000175051A (ja) デジタル画像デ―タの区分方法並びにデ―タブロックの区分方法及び分類方法
JP2003152995A (ja) 画像処理装置
JP2018139457A (ja) 画像処理装置、画像処理の制御方法、及びプログラム
JP2003244447A (ja) 画像処理装置及び画像処理方法
JP2003338935A (ja) 画像処理装置および方法
JPH0879517A (ja) 画像の型を識別する方法
JP2002369011A (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP2003069843A (ja) 画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体
JP4250316B2 (ja) 画像圧縮装置、画像伸長装置、及びその方法並びに記憶媒体
JP4228905B2 (ja) 画像処理装置及びプログラム
JP2003338934A (ja) 画像処理装置および方法
JP4383187B2 (ja) 画像処理装置、画像処理用プログラム及び記憶媒体
JP3471925B2 (ja) 複写装置及び画像処理方法
JP2024080365A (ja) 画像処理装置、その制御方法およびプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050405

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050425

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050624

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050715

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050722

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050812

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050826

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 3715905

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090902

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090902

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100902

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110902

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110902

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120902

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120902

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130902

Year of fee payment: 8

EXPY Cancellation because of completion of term