JP2007507802A - デジタル画像におけるテキスト状エッジの強調 - Google Patents

デジタル画像におけるテキスト状エッジの強調 Download PDF

Info

Publication number
JP2007507802A
JP2007507802A JP2006533978A JP2006533978A JP2007507802A JP 2007507802 A JP2007507802 A JP 2007507802A JP 2006533978 A JP2006533978 A JP 2006533978A JP 2006533978 A JP2006533978 A JP 2006533978A JP 2007507802 A JP2007507802 A JP 2007507802A
Authority
JP
Japan
Prior art keywords
pixel
class
image
text
pixels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006533978A
Other languages
English (en)
Other versions
JP4423298B2 (ja
Inventor
ムケージェ,デバーガ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hewlett Packard Development Co LP
Original Assignee
Hewlett Packard Development Co LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Development Co LP filed Critical Hewlett Packard Development Co LP
Publication of JP2007507802A publication Critical patent/JP2007507802A/ja
Application granted granted Critical
Publication of JP4423298B2 publication Critical patent/JP4423298B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/409Edge or detail enhancement; Noise or error suppression
    • H04N1/4092Edge or detail enhancement
    • G06T5/75

Abstract

デジタル画像においてテキスト状エッジを強調するシステム及び方法が説明される。一態様では、画像ピクセルのブロック(27)のピクセルが第1のピクセルクラス(29)及び第2のピクセルクラス(31)にセグメント化される。第1のクラス(29)及び第2のクラス(31)の強度分布をそれぞれ表す強度値を分離する距離の測度に基づいて、且つ第1のピクセルクラス(29)及び第2のピクセルクラス(31)の両方に対して計算された強度ヒストグラムの尖りの測度に基づいて、ピクセルブロック(27)が少なくとも1つのテキスト状エッジを含む可能性が高いという判断に応じて、このピクセルブロック(27)がエッジ強調される。
【選択図】図1

Description

本発明は、デジタル画像においてテキスト状エッジを強調するシステム及び方法に関する。
背景
例えば、カラースキャナ及びカラープリンタを使用して再現されるデジタル画像におけるテキスト状エッジは、そのテキスト状エッジの近くに色縁及び他のアーティファクトが存在することによって劣化することが多い。画像とテキストとをともに含むスキャンされた複合文書は、特にこうした劣化を受けやすい。これらのアーティファクトが存在することにより、再現されるデジタル画像の全体の外観の品質が大幅に劣化する。さらに、こうした劣化は、様々な圧縮アルゴリズムがデジタル画像を格納するために必要なメモリの量を低減するためにデジタル画像を符号化する場合の効率に悪影響を及ぼす。例えば、いわゆる「可逆的」圧縮方式は、一般に、スキャンされた画像には有効に働かない。一方、いわゆる「不可逆的」圧縮方法は、一般に、スキャンされた画像の連続階調領域には有効に働くが、スキャンされた画像のテキストを含む領域には有効に働かない。
複合文書は、ミクストラスタコンテント(mixed raster content)(MRC)文書画像表現フォーマットを使用して効率的に圧縮され得る。この圧縮方式では、画像は、2つ以上の画像プレーン(plane:面、平面)にセグメント化される。セレクタプレーンは、各ピクセルに対し、画像プレーンのうちのいずれが最終出力画像を復元するために使用されるべき画像データを含むかを示す。この手法では、画像データが、オリジナル画像より平滑であり、且つより圧縮できる別個のプレーンにセグメント化され得ることが多いため、全体的な画像圧縮度を上昇させることができる。また、セグメント化されたプレーンに対して異なる圧縮方法を適用してもよく、それにより全体的な画像圧縮度をさらに上昇させることが可能になる。
スキャンされた複合文書のカラーピクセルマップ又はグレイスケールピクセルマップをMRCフォーマットに圧縮するために処理する1つの手法は、元のピクセルマップを2つのプレーンにセグメント化すること、及び各プレーンのデータを圧縮することを含む。画像は、その画像をエッジにおいて2つの部分に分離することによってセグメント化される。一方のプレーンは、エッジの暗い側の画像データを含むが、エッジの明るい側及び画像の平滑な部分の画像データは他方のプレーンに配置される。
スキャンされた文書の画像を処理する別の手法は、視覚的ノイズを含むデジタル画像においてテキストのエッジを検出するエッジ検出器を含む。背景輝度推定器が、画像背景輝度の推定に基づく背景閾値を生成する。背景閾値は、検出されたエッジのエッジピクセルの輝度値によって決まる。一実施形態では、背景閾値は、検出されたエッジの明るい方の側にあるエッジピクセルのみを使用して生成される。画像強調器は、背景閾値を使用して画像のピクセル値を選択的に変更することにより、スキャンされた文書における視覚的ノイズを少なくとも部分的に除去する。また、画像強調器は、エッジ鮮鋭化(sharpening)及びエッジ暗化(darkening)のような、色縁の除去及びテキスト強調を実行することもできる。
また、デジタル画像においてエッジ特徴部分を鮮鋭化するために、様々なアンシャープマスキング手法もまた提案されてきた。一般に、アンシャープマスクフィルタは、入力画像からアンシャープマスク(即ち、見本画像を、ガウスローパスフィルタを用いて空間フィルタリングすることによって生成されるぼやけた画像)を減じる。一手法では、アンシャープマスクフィルタは、画像の最大局所コントラストを所定の目標値まで増大させ、他のすべてのコントラストをその所定の目標値に比例する量まで増大させる。適応空間フィルタ手法では、繰返し調整可能なアクティビティ閾値に近いアクティビティ値を有する入力画像のピクセルは、実質的にその閾値を上回るアクティビティ値を有する画像ピクセルより選択的に小さく強調される。別の空間フィルタリング方法では、適応エッジ強調プロセスは、急峻な階調の勾配を有する画像における特徴部分の鮮鋭度を強調する。
概要
本発明は、デジタル画像においてテキスト状画像を強調するシステム及び方法を特徴とする。
一態様では、本発明はピクセルの画像においてテキスト状エッジを強調する方法を特徴とする。本発明の方法によれば、画像ピクセルのブロックのピクセルが、第1のピクセルクラス及び第2のピクセルクラスにセグメント化される。第1のクラス及び第2のクラスの強度分布をそれぞれ表す強度値を分離する距離の測度に基づいて、且つ第1のピクセルクラス及び第2のピクセルクラスの両方に対して計算された強度ヒストグラムの尖りの測度に基づいて、ピクセルブロックが少なくとも1つのテキスト状エッジを含む可能性が高いという判断に応じて、このピクセルブロックがエッジ強調される。
別の態様では、本発明は、上述したテキスト状エッジの強調方法を実現するように動作可能な画像強調エンジンを特徴とする。
本発明の他の特徴及び利点については、図面及び特許請求の範囲を含む以下の説明から明らかとなろう。
詳細な説明
以下の説明において、同様の参照符号を使用して同様の要素を識別する。さらに、図面は、例示的な実施形態の主な特徴部分を概略的に示すように意図されている。図面は、実際の実施形態のすべての特徴部分を示すようにも、図示される要素の相対的な寸法を示すようにも意図されておらず、一律の縮尺に従わずに描かれている。
以下で詳細に説明される実施形態は、デジタル画像におけるテキスト状エッジを強調する。これらの実施形態では、デジタル画像データのブロックにおけるテキスト状エッジは、ピクセルブロックの強度ヒストグラムにおいて実質的に双峰分布が存在することにより証明される。このような証明に基づき、これらの実施形態は、テキスト状エッジの存在を正確に検出する。これにより画像の非テキスト状領域にアーティファクトをもたらす可能性を低減しつつ、画像におけるテキスト状エッジのコントラストを強調することが可能になる。
図1は、オリジナル画像12を処理して、テキスト状エッジのコントラストが強調された強調画像14にするように動作可能な画像強調エンジン10の一実施形態を示す。
オリジナル画像12は、ロゴ(例えば、会社のロゴ)、グラフィックス、写真、テキスト、イメージ、又は視覚的意味を有する任意のパターンを含む、任意のタイプの画像コンテンツを含むことができる。画像コンテンツは、オリジナル画像12の境界領域、前景又は背景に現れる可能性がある。また、画像コンテンツは、2値画像(例えば、白黒ドットパターン)、マルチレベル画像(例えば、グレーレベル画像)、又はマルチレベルカラー画像の形態とすることができる。オリジナル画像12は、ビットマップグラフィックスエンジン、ベクトルグラフィックスエンジン、及び従来の卓上光スキャナ(例えば、米国カリフォルニア州パロアルトのヒューレットパッカードカンパニーから販売されているScanJet(登録商標)スキャナ)、ポータブルスキャナ(例えば、米国カリフォルニア州パロアルトのヒューレットパッカードカンパニーから販売されているCapShare(登録商標)ポータブルスキャナ)、又は従来のファクシミリ装置等のスキャナを含む、任意のデジタル画像形成プロセス又は装置によって生成され得る。
図1及び図2を参照すると、いくつかの実施形態では、画像強調エンジン10は、画像フィルタモジュール16とテキスト状エッジ強調モジュール18とを含む。いくつかの実施形態では、画像フィルタモジュール16及びテキスト状エッジ強調モジュール18は、コンピュータ(又はワークステーション)で実行可能な1つ又は複数のそれぞれのソフトウェアモジュールとして実施される。一般に、画像フィルタモジュール16及びテキスト状エッジ強調モジュール18が実行され得るコンピュータ(又はワークステーション)は、処理ユニット、システムメモリ、及び処理ユニットをコンピュータの様々なコンポーネントに結合するシステムバスを含む。処理ユニットは、1つ又は複数のプロセッサを含んでもよく、それらの各々は、様々な市販のプロセッサのうちの任意のプロセッサの形態とすることができる。システムメモリは一般に、コンピュータの起動ルーチンを含む基本入出力システム(BIOS)を格納するリードオンリメモリ(ROM)と、ランダムアクセスメモリ(RAM)とを含む。システムバスは、メモリバス、周辺バス、又はローカルバスとすることができ、PCI、VESA、Microchannel、ISA及びEISAを含む種々のバスプロトコルのうちの任意のものと互換性があってもよい。また、コンピュータは、それぞれのインタフェースによってシステムバスに接続されるハードドライブ、フロッピー(R)ドライブ、及びCD−ROMドライブを含むことができる。ハードドライブ、フロッピー(R)ドライブ、及びCD−ROMドライブは、データ、データ構造、及びコンピュータ実行可能命令のために不揮発性記憶又は永続的記憶を提供するそれぞれのコンピュータ読取可能媒体ディスクを含む。また、他のコンピュータ読取可能記憶デバイス(例えば、磁気テープドライブ、フラッシュメモリデバイス、及びデジタルビデオディスク)をコンピュータと共に使用してもよい。ユーザは、キーボード及びマウスを使用してコンピュータと対話(例えば、コマンド又はデータを入力)することができる。また、他の入力デバイス(例えば、マイクロフォン、ジョイスティック、又はタッチパッド)を設けてもよい。モニタ又は他の表示技術を用いて、ユーザに情報を表示することができる。また、コンピュータは、スピーカ及びプリンタ等の周辺出力デバイスを含むこともできる。さらに、ローカルエリアネットワーク(LAN)又は広域ネットワーク(WAN)(例えば、インターネット)により、1つ又は複数のリモートコンピュータをコンピュータに接続することができる。
画像フィルタモジュール16は、オリジナル画像12にノイズフィルタを適用することにより、ノイズフィルタリングされた画像(以降、ノイズフィルタリング画像と称する)20を生成する(ステップ22)。ノイズフィルタは、オリジナル画像12のノイズアーティファクトを低減する任意のタイプのフィルタとすることができる。例えば、一具現化形態では、ノイズフィルタは、インパルスノイズ除去フィルタである。この具現化形態では、インパルスノイズ除去フィルタは、すべての所与の画像ピクセルを、その所与の画像ピクセルを中心とする3×3ウィンドウにおけるそのピクセルの周囲の8つの隣接ピクセルと比較する。オリジナル画像12にわたる各ウィンドウの位置に対して、隣接ピクセルの少なくとも1つが中心ピクセルに近い色である場合、中心ピクセルはフィルタリングされない。一方、8つの隣接ピクセルのすべてが中心ピクセルとは十分に異なる場合、中心ピクセルは、8つの周囲隣接体の中間の色によって置き換えられる。例えば、一具現化形態では、中心ピクセルは、周囲の8つの隣接ピクセルの赤色成分、緑色成分、及び青色成分の中央値によって置き換えられる。この具現化形態では、赤色成分、緑色成分、及び青色成分の中央値は別個に計算される。画像フィルタモジュール16によって、オリジナル画像12におけるノイズアーティファクトを除去することにより、強調画像14の任意の後続する圧縮符号化が容易になる。
また、画像フィルタモジュール16は、ノイズフィルタリング画像20に対して平滑化フィルタを適用して、平滑化画像24も生成する(ステップ26)。平滑化フィルタは、任意のタイプの平滑化フィルタとすることができる。一具現化形態では、平滑化フィルタは、3×3のスライディングウィンドウにわたってノイズフィルタによって生成されたノイズフィルタリング画像に適用されるガウス平滑化フィルタである。結果としての平滑化画像24は、テキスト状エッジ強調モジュール18によって、オリジナル画像12におけるテキスト状エッジを検出するために使用される。さらに、平滑化画像24は、強調画像14に適用され得る任意の後続の画像圧縮プロセスにおけるベース確定アルゴリズム及び色分解アルゴリズムにおいて使用され得る。
図2、図3及び図4を参照すると、いくつかの実施形態では、テキスト状エッジ強調モジュール18は、以下のようにブロック単位で平滑化画像24のテキスト状エッジを検出する(図2、ステップ28)。
テキスト状エッジ強調モジュール18は、平滑化画像24におけるピクセルのブロック27(図4)を取得する(図3、ステップ30)。ピクセルのブロックはN×Mピクセルブロックとすることができ、この場合、NとMはそれぞれ、ブロックにおけるピクセル行及びピクセル列の数に対応する整数である。概して、ピクセルブロックのサイズは、オリジナル画像12の解像度に依存する。例えば、いくつかの具現化形態では、オリジナル画像12の解像度が300ドット/インチ(dpi)である場合、8×8ピクセルブロックが使用され、オリジナル画像12の解像度が600dpiである場合、16×16ピクセルブロックが使用される。
取得されたピクセルのブロックにおけるピクセルは、第1のクラス(又はプレーン)29及び第2のクラス(又はプレーン)31にセグメント化される(ステップ32)。いくつかの具現化形態では、ピクセルは、ピクセルの強度値に基づいて明るいピクセルのクラス及び暗いピクセルのクラスにセグメント化される。強度値は、Y、Cr、Cb色空間で表されるピクセルの輝度(Y)値から直接的に取得され得る。代案として、強度値は、他の色空間表現でピクセルの強度値を計算することによって間接的に取得されてもよい。ピクセルは、任意の強度値セグメント化プロセスを使用してセグメント化され得る。いくつかの具現化形態では、ピクセルブロックにおける最大ピクセル強度値及び最小ピクセル強度値に対応するカラーピクセルによって初期化されたピクセルに対して、k平均ベクトル量子化プロセス(k=2)を適用することにより、ピクセルを明るいピクセルのクラス及び暗いピクセルのクラスにセグメント化する。
テキスト状エッジ強調モジュール18は、第1のクラス及び第2のクラスに対してピクセルクラス間強度分離テストを適用することにより、ピクセルブロックからテキスト状エッジを選別する(ステップ34)。ピクセルクラス間強度分離テストは、第1のピクセルクラスと第2のピクセルクラスとが、2つのクラスがテキスト状エッジに対応する境界を特徴付けるほど十分に強度が分離しているか否かを判断する。いくつかの具現化形態では、ピクセルクラス間強度分離テストは、第1のクラス及び第2のクラスをそれぞれ表す強度値間の距離の測度(measure:尺度)を計算することを含む。第1のクラス及び第2のクラスに対する強度値の平均値(mean)、最頻値、中央値、中心、及び平均値(average)を含む、第1のピクセルクラス及び第2のピクセルクラスの強度を表す任意の統計的測度を使用することができる。第1のクラス及び第2のクラスに対する計算された代表的な強度値を分離する距離を、所定の実験的に決定された閾値と比較することにより、第1のクラス及び第2のクラスが、テキスト状エッジに対応する可能性が高いように強度が十分に分離されているか否かを判断する。第1のクラス及び第2のクラスの強度が十分に分離されている場合(ステップ36)、テキスト状エッジ強調モジュール18は、第1のクラス及び第2のクラスの各々に強度分布尖り(peakedness)テストを適用する(ステップ38)。そうでない場合、ブロックに対してテキスト状エッジ強調を実行せず、テキスト状エッジ強調モジュール18は次のピクセルブロックを取得する(ステップ30)。
強度分布尖りテストにより、第1のピクセルクラス及び第2のピクセルクラスの各々が、ピクセルブロックが少なくとも1つのテキスト状エッジを含む可能性が高いほど十分尖った強度ヒストグラムによって特徴付けられるか否かを判断する。いくつかの実施形態では、強度ヒストグラムを、ノイズフィルタリング画像20のピクセル値から計算する。図5に示されるように、例えば、テキスト状エッジを含むピクセルブロックの例示的な強度ヒストグラム40は、明るいクラス42及び暗いクラス44にセグメント化されるピクセルによって特徴付けられ、それらの各々は明確なピーク46、48によって特徴付けられる。任意の尖りの統計的測度を使用して、各ピクセルクラス42、44の強度ヒストグラムが十分に尖っているか否かを判断してもよい。一具現化形態では、尖度(kurtosis)(即ち、標準偏差の4乗に対する分布の4次中心積率)を尖りの測度として使用する。この具現化形態では、尖度を、所定の実験的に決定された閾値と比較する。概して、所定の尖度閾値は、1.8(一様の強度ヒストグラムに対応する)と3.0(ガウス強度ヒストグラムに対応する)との間に入らなければならない。例示的な具現化形態では、尖度閾値は、2.0と2.5との間であることが好ましい。第1のピクセルクラス及び第2のピクセルクラスの両方の強度ヒストグラムが十分に尖っている場合(ステップ50)、ピクセルブロックをテキスト状エッジ強調のために選択する(ステップ52)。そうでない場合、ブロックに対してテキスト状エッジ強調を実行せず、テキスト状エッジ強調モジュール18は次のピクセルブロックを取得する(ステップ30)。
再び図2を参照すると、平滑化画像24のピクセルブロックにおいて少なくとも1つのテキスト状エッジが検出された後(ステップ28)、ノイズフィルタリング画像20のテキスト状エッジが強調される(ステップ53)。
図6、図7A、図7B、図8A及び図8Bに示されるように、いくつかの実施形態では、ピクセルブロックのテキスト状エッジは、第1のクラス及び第2のクラスのピクセルの強度値を制御された態様で引き離すことによって強調される。この目的のために、現在のピクセルブロックのピクセルを取得する(ステップ54)。ピクセルが、第1のピクセルクラス及び第2のピクセルクラスに対して計算された第1の中央強度値と第2の中央強度値との間の強度値を有する場合(ステップ56)、このピクセルを「中間ピクセル」と呼び、その強度値は、ピクセルがセグメント化されたピクセルクラスの中央強度値に向かってシフトされる(ステップ58)。例えば、第1のピクセルクラス42及び第2のピクセルクラス44がそれぞれ、図7A及び図7Bに示された、中央強度値60、62を有する十分に尖った強度ヒストグラムによって特徴付けられるものとする。この例において、中央ピクセル値60より大きい(即ち、その右側の)強度値を有する第1のクラス42のピクセルは、図8Aに示されるように強度において下方に(即ち、左に)シフトされる。同様に、中央ピクセル値62より小さい(即ち、その左側の)強度値を有する第2のクラス44のピクセルは、図8Bに示されるように強度において上方に(即ち、右に)シフトされる。いくつかの具現化形態では、中間ピクセル値の強度は、第1のピクセルクラス及び第2のピクセルクラスの中央強度値を変更することなくシフトされる。これらの具現化形態の1つにおいて、各中間ピクセルの強度値は、その距離をそのピクセルクラスの中央強度値から固定の割合(例えば、2)だけ低減することによってシフトされる。これらの具現化形態において、オリジナル画像12の濃淡が過度に明るくなる、又は過度に暗くなる可能性が低減される。
ピクセルが、第1のピクセルクラス及び第2のピクセルクラスに対して計算された第1の中央強度値と第2の中央強度値との間の強度値を有していない(即ち、ピクセルが中間ピクセルでない)場合(ステップ56)、その非中間ピクセルの強度値をシフトさせることなく次のピクセルを取得する。
図9は、上述したテキスト状エッジ強調実施形態の具現化形態を組み込んだ、オリジナル画像12をミクストラスタコンテント(MRC)フォーマットに圧縮する方法の一実施形態を示す。この実施形態では、オリジナル画像12におけるテキスト状エッジをノイズフィルタリングして強調することによって生成される強調画像14を取得する(ステップ70)。強調画像14のピクセルのブロックを取得する(ステップ72)。ブロックのピクセルが、第1の画像プレーン及び第2の画像プレーンにセグメント化される(ステップ74)。例えば、予め選択された閾値に基づいて、ピクセルを背景画像プレーン及び前景画像プレーンにセグメント化してもよい。第1の画像プレーン及び第2の画像プレーンは、強調画像14と同じビット深さ及び色の数で格納される。いくつかの具現化形態では、第1の画像プレーン及び第2の画像プレーンは、強調画像14とは異なる(例えば、それより低い)解像度で格納されてもよい。セレクタプレーンを生成して、ビットマップとして格納する(ステップ76)。セレクタプレーンは、強調画像14のピクセルを、第1の画像プレーン及び第2の画像プレーンの対応するピクセルにマッピングする。強調画像14において処理するピクセルブロックがさらにある場合(ステップ78)、ピクセルの次のブロックを取得する(ステップ70)。そうでない場合、セレクタプレーン並びに第1の画像プレーン及び第2の画像プレーンを圧縮する(ステップ80)。セレクタプレーン及び画像プレーンは一般に、プレーンに含まれるデータのタイプに適した方法を使用して圧縮される。例えば、第1の画像プレーン及び第2の画像プレーンは、可逆的圧縮フォーマット(例えば、gzip又はCCITT−G4)を使用して圧縮されて格納され得る。セレクタプレーンは、例えば、グループ4(MMR)画像圧縮フォーマットを使用して圧縮されてもよい。
他の実施形態は特許請求の範囲内にある。
本明細書で説明されたシステム及び方法は、任意の特定のハードウェア又はソフトウェア構成に限定されず、むしろそれらは、デジタル電子回路、又はコンピュータハードウェア、ファームウェア又はソフトウェアを含む任意のコンピューティング環境又は処理環境において実現され得る。
オリジナル画像を処理して、テキスト状エッジが強調された強調画像にするように動作可能な画像強調エンジンの一実施形態のブロック図である。 強調画像へとオリジナル画像を処理するために、図1の画像強調エンジンによって実行される方法の一実施形態のフローチャートである。 画像におけるテキスト状エッジを強調する方法の一実施形態のフローチャートである。 第1のピクセルクラス及び第2のピクセルクラスにセグメント化される画像のピクセルのブロックの概略図である。 画像のピクセルブロックにおけるピクセルの強度値のヒストグラムである。 画像におけるテキスト状エッジを強調する方法の一実施形態のフローチャートである。 明るいピクセルのクラスにセグメント化されたピクセルの強度値のヒストグラムである。 暗いピクセルのクラスにセグメント化されたピクセルの強度値のヒストグラムである。 中間ピクセルの値が明るいピクセルのクラスの中央強度値に向かってシフトした後の図7Aの明るいピクセルのクラスにおけるピクセルの強度値のヒストグラムである。 中間ピクセルの値が暗いピクセルのクラスの中央強度値に向かってシフトした後の図7Bの明るいピクセルのクラスにおけるピクセルの強度値のヒストグラムである。 図3のテキスト状エッジ強調方法を組み込んだ、画像を圧縮する方法の一実施形態のフローチャートである。

Claims (10)

  1. ピクセルの画像(12)においてテキスト状エッジを強調する方法であって、
    画像ピクセルのブロック(27)のピクセルを第1のピクセルクラス(29)及び第2のピクセルクラス(31)にセグメント化するステップと、
    前記第1のクラス(29)及び前記第2のクラス(31)の強度分布をそれぞれ表す強度値を分離する距離の測度に基づいて、且つ前記第1のピクセルクラス(29)及び前記第2のピクセルクラス(31)の両方に対して計算された強度ヒストグラムの尖りの測度に基づいて、前記ピクセルブロック(27)が少なくとも1つのテキスト状エッジを含む可能性が高いという判断に応じて、前記ピクセルブロック(27)をエッジ強調するステップとを含む、テキスト状エッジを強調する方法。
  2. 前記ピクセルをセグメント化することが、前記ブロック(27)のピクセルの強度に基づいて前記ブロック(27)のピクセルを明るいピクセルのクラス(29)と暗いピクセルのクラス(31)とに分類することを含む、請求項1に記載の方法。
  3. 前記距離の測度が、それぞれ前記第1のピクセルクラス(29)及び前記第2のピクセルクラス(31)に対して計算された第1の平均強度値と第2の平均強度値との間の距離の測度に対応し、前記ピクセルブロック(27)が少なくとも1つのテキスト状エッジを含む可能性が高いという前記判断は、前記第1の平均強度値と前記第2の平均強度値との間の前記距離の測度と閾値との比較に基づいている、請求項1に記載の方法。
  4. 前記ピクセルブロック(27)をエッジ強調する前記ステップが、前記第1の平均強度値と前記第2の平均強度値との間の前記距離の測度が前記閾値を下回るという判断に応じて省略される、請求項3に記載の方法。
  5. 前記ピクセルブロックが少なくとも1つのテキスト状エッジを含む可能性が高いという前記判断が、前記尖りの測度とそれぞれの閾値との比較に基づいている、請求項1に記載のテキスト状エッジを強調する方法。
  6. 前記ピクセルブロック(27)をエッジ強調する前記ステップは、前記第1のピクセルクラス及び前記第2のピクセルクラスの一方又は両方の前記尖りの測度がそれぞれの閾値を下回るという判断に応じて省略される、請求項5に記載の方法。
  7. ピクセルが前記第1のピクセルクラス(29)及び前記第2のピクセルクラス(31)にセグメント化される前に、前記画像(12)に対してノイズフィルタを適用すること、
    ピクセルが前記第1のピクセルクラス(29)及び前記第2のピクセルクラス(31)にセグメント化される前に、前記画像(12)に対してガウス平滑化フィルタを適用することをさらに含む、請求項1に記載の方法。
  8. エッジ強調する前記ステップが、それぞれ前記第1のピクセルクラス(29)及び前記第2のピクセルクラス(31)に対して計算された第1の中央強度値と第2の中央強度値との間の強度値を有する中間ピクセルの強度値をシフトさせるステップを含む、請求項1に記載の方法。
  9. 任意の所与の中間ピクセルの前記強度値は、前記所与の中間ピクセルがセグメント化された前記ピクセルクラス(29、31)の前記中央強度値に向かってシフトされ、中間ピクセル強度値が、前記第1のピクセルクラス(29)及び前記第2のピクセルクラス(31)に対する前記第1の中央強度値及び前記第2の中央強度値を変更することなくシフトされる、請求項8に記載の方法。
  10. ピクセルの画像(12)においてテキスト状エッジを強調するシステムであって、
    画像強調エンジン(10)を含み、その画像強調エンジン(10)が、
    画像ピクセルのブロック(27)のピクセルを第1のピクセルクラス(29)及び第2のピクセルクラス(31)にセグメント化し、
    前記第1のクラス(29)及び前記第2のクラス(31)の強度分布をそれぞれ表す強度値を分離する距離の測度に基づいて、且つ前記第1のピクセルクラス(29)及び前記第2のピクセルクラス(31)の両方に対して計算された強度ヒストグラムの尖りの測度に基づいて、前記ピクセルブロック(27)が少なくとも1つのテキスト状エッジを含む可能性が高いという判断に応じて、前記ピクセルブロック(27)をエッジ強調するように動作可能である、テキスト状エッジを強調するシステム。
JP2006533978A 2003-09-30 2004-09-24 デジタル画像におけるテキスト状エッジの強調 Expired - Fee Related JP4423298B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/675,387 US7433535B2 (en) 2003-09-30 2003-09-30 Enhancing text-like edges in digital images
PCT/US2004/031330 WO2005034038A1 (en) 2003-09-30 2004-09-24 Enhancing text-like edges in digital images

Publications (2)

Publication Number Publication Date
JP2007507802A true JP2007507802A (ja) 2007-03-29
JP4423298B2 JP4423298B2 (ja) 2010-03-03

Family

ID=34377138

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006533978A Expired - Fee Related JP4423298B2 (ja) 2003-09-30 2004-09-24 デジタル画像におけるテキスト状エッジの強調

Country Status (4)

Country Link
US (1) US7433535B2 (ja)
EP (1) EP1668594A1 (ja)
JP (1) JP4423298B2 (ja)
WO (1) WO2005034038A1 (ja)

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7454068B2 (en) * 2003-11-12 2008-11-18 International Business Machines Corporation System and method for providing black white image compression
US20050135703A1 (en) * 2003-12-18 2005-06-23 Zhuo Ya Wang Method of removing stains from digital images
US7515758B2 (en) * 2004-02-03 2009-04-07 International Business Machines Corporation Black white image compression having print density control
US8204306B2 (en) * 2004-06-14 2012-06-19 Xerox Corporation Method for image segmentation based on block clustering for improved processing of touching characters
US7830552B2 (en) * 2005-04-15 2010-11-09 International Business Machines Corporation Black white image scaling having print density control and polarity detection
US7570796B2 (en) 2005-11-18 2009-08-04 Kla-Tencor Technologies Corp. Methods and systems for utilizing design data in combination with inspection data
US7756355B2 (en) * 2006-05-05 2010-07-13 Aptina Imaging Corp. Method and apparatus providing adaptive noise suppression
JP4752719B2 (ja) * 2006-10-19 2011-08-17 ソニー株式会社 画像処理装置、画像取得方法及びプログラム
US8885076B2 (en) * 2007-03-30 2014-11-11 Hewlett-Packard Development Company, L.P. Camera sensor defect correction and noise reduction
KR100866492B1 (ko) * 2007-05-30 2008-11-03 삼성전자주식회사 에지 향상 기능을 갖는 노이즈 저감 장치 및 방법
US8116581B2 (en) * 2007-06-28 2012-02-14 Microsoft Corporation Efficient image representation by edges and low-resolution signal
KR101841897B1 (ko) 2008-07-28 2018-03-23 케이엘에이-텐코어 코오포레이션 웨이퍼 상의 메모리 디바이스 영역에서 검출된 결함들을 분류하기 위한 컴퓨터-구현 방법들, 컴퓨터-판독 가능 매체, 및 시스템들
US8442348B2 (en) * 2008-11-06 2013-05-14 Seiko Epson Corporation Image noise reduction for digital images using Gaussian blurring
US8775101B2 (en) 2009-02-13 2014-07-08 Kla-Tencor Corp. Detecting defects on a wafer
US9129409B2 (en) * 2009-07-29 2015-09-08 Qualcomm Incorporated System and method of compressing video content
EP2517170A2 (en) * 2009-12-24 2012-10-31 BAE Systems PLC Image enhancement
US8340363B2 (en) 2010-05-27 2012-12-25 Palo Alto Research Center Incorporated System and method for efficient interpretation of images in terms of objects and their parts
US8781781B2 (en) 2010-07-30 2014-07-15 Kla-Tencor Corp. Dynamic care areas
DK2725655T3 (da) 2010-10-12 2021-09-20 Gn Hearing As Antennesystem til et høreapparat
US9170211B2 (en) 2011-03-25 2015-10-27 Kla-Tencor Corp. Design-based inspection using repeating structures
US9087367B2 (en) 2011-09-13 2015-07-21 Kla-Tencor Corp. Determining design coordinates for wafer defects
JP5826001B2 (ja) 2011-11-30 2015-12-02 キヤノン株式会社 画像処理装置、及びその制御方法
US20130163871A1 (en) * 2011-12-22 2013-06-27 General Electric Company System and method for segmenting image data to identify a character-of-interest
US8831334B2 (en) * 2012-01-20 2014-09-09 Kla-Tencor Corp. Segmentation for wafer inspection
US8826200B2 (en) 2012-05-25 2014-09-02 Kla-Tencor Corp. Alteration for wafer inspection
US9189844B2 (en) 2012-10-15 2015-11-17 Kla-Tencor Corp. Detecting defects on a wafer using defect-specific information
JP5939154B2 (ja) * 2012-12-27 2016-06-22 ブラザー工業株式会社 画像処理装置およびコンピュータプログラム
US9053527B2 (en) 2013-01-02 2015-06-09 Kla-Tencor Corp. Detecting defects on a wafer
US9134254B2 (en) 2013-01-07 2015-09-15 Kla-Tencor Corp. Determining a position of inspection system output in design data space
US9311698B2 (en) 2013-01-09 2016-04-12 Kla-Tencor Corp. Detecting defects on a wafer using template image matching
KR102019534B1 (ko) 2013-02-01 2019-09-09 케이엘에이 코포레이션 결함 특유의, 다중 채널 정보를 이용한 웨이퍼 상의 결함 검출
US9865512B2 (en) 2013-04-08 2018-01-09 Kla-Tencor Corp. Dynamic design attributes for wafer inspection
KR102016424B1 (ko) * 2013-04-12 2019-09-02 삼성디스플레이 주식회사 데이터 처리 장치 및 이를 갖는 디스플레이 시스템
US9310320B2 (en) 2013-04-15 2016-04-12 Kla-Tencor Corp. Based sampling and binning for yield critical defects
JPWO2017006401A1 (ja) * 2015-07-03 2018-04-19 オリンパス株式会社 画像処理装置、画像処理方法及び画像処理プログラム
JP6824619B2 (ja) * 2016-03-31 2021-02-03 キヤノン株式会社 画像処理装置、およびその制御方法
CN106791883A (zh) * 2016-11-18 2017-05-31 上海兆芯集成电路有限公司 纹理砖压缩及解压缩方法以及使用该方法的装置
US10999602B2 (en) 2016-12-23 2021-05-04 Apple Inc. Sphere projected motion estimation/compensation and mode decision
US11259046B2 (en) 2017-02-15 2022-02-22 Apple Inc. Processing of equirectangular object data to compensate for distortion by spherical projections
US10924747B2 (en) 2017-02-27 2021-02-16 Apple Inc. Video coding techniques for multi-view video
US9992450B1 (en) * 2017-03-24 2018-06-05 Apple Inc. Systems and methods for background concealment in video conferencing session
US11093752B2 (en) 2017-06-02 2021-08-17 Apple Inc. Object tracking in multi-view video
US10754242B2 (en) 2017-06-30 2020-08-25 Apple Inc. Adaptive resolution and projection format in multi-direction video
CN109427047B (zh) * 2017-08-28 2021-01-26 京东方科技集团股份有限公司 一种图像处理方法及装置
US11188745B2 (en) * 2019-09-13 2021-11-30 At&T Intellectual Property I, L.P. Enhancing electronic documents for character recognition

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5838880A (ja) * 1981-08-31 1983-03-07 Tokyo Optical Co Ltd 光波距離計
CH675133A5 (ja) * 1987-07-06 1990-08-31 Zellweger Uster Ag
US5202933A (en) * 1989-12-08 1993-04-13 Xerox Corporation Segmentation of text and graphics
US5179599A (en) * 1991-06-17 1993-01-12 Hewlett-Packard Company Dynamic thresholding system for documents using structural information of the documents
EP0578875A1 (en) 1992-07-17 1994-01-19 Recognition International Inc. Normalizing correlator for video processing
US5515452A (en) * 1992-12-31 1996-05-07 Electroglas, Inc. Optical character recognition illumination method and system
WO1996009600A1 (en) * 1994-09-20 1996-03-28 Neopath, Inc. Apparatus for identification and integration of multiple cell patterns
US5745596A (en) * 1995-05-01 1998-04-28 Xerox Corporation Method and apparatus for performing text/image segmentation
US5946420A (en) * 1996-05-10 1999-08-31 Hewlett-Packard Company Printing with text enhancement: recognition by sensing paired edges, or by disqualification in pictorial regions
US5852678A (en) * 1996-05-30 1998-12-22 Xerox Corporation Detection and rendering of text in tinted areas
US5956468A (en) * 1996-07-12 1999-09-21 Seiko Epson Corporation Document segmentation system
JP3546914B2 (ja) * 1996-10-18 2004-07-28 富士ゼロックス株式会社 光学測定方法、光学測定装置および画像形成装置
JPH10200724A (ja) * 1997-01-06 1998-07-31 Minolta Co Ltd 画像読み取り装置
JP3881439B2 (ja) 1998-01-23 2007-02-14 シャープ株式会社 画像処理装置
US6227725B1 (en) * 1998-08-18 2001-05-08 Seiko Epson Corporation Text enhancement for color and gray-scale documents
US6346124B1 (en) * 1998-08-25 2002-02-12 University Of Florida Autonomous boundary detection system for echocardiographic images
US6400844B1 (en) * 1998-12-02 2002-06-04 Xerox Corporation Method and apparatus for segmenting data to create mixed raster content planes
US6782143B1 (en) * 1999-12-30 2004-08-24 Stmicroelectronics, Inc. Method and apparatus for processing an image
US6757081B1 (en) * 2000-04-07 2004-06-29 Hewlett-Packard Development Company, L.P. Methods and apparatus for analyzing and image and for controlling a scanner
US6633683B1 (en) * 2000-06-26 2003-10-14 Miranda Technologies Inc. Apparatus and method for adaptively reducing noise in a noisy input image signal
US6621595B1 (en) 2000-11-01 2003-09-16 Hewlett-Packard Development Company, L.P. System and method for enhancing scanned document images for color printing
US7043080B1 (en) * 2000-11-21 2006-05-09 Sharp Laboratories Of America, Inc. Methods and systems for text detection in mixed-context documents using local geometric signatures
US6909803B2 (en) * 2000-12-22 2005-06-21 Canon Kabushiki Kaisha Text color detection for copier image processing
US7302111B2 (en) * 2001-09-12 2007-11-27 Micronic Laser Systems A.B. Graphics engine for high precision lithography
US6817982B2 (en) * 2002-04-19 2004-11-16 Sonosite, Inc. Method, apparatus, and product for accurately determining the intima-media thickness of a blood vessel
US7295706B2 (en) * 2002-07-12 2007-11-13 Chroma Group, Inc. Pattern recognition applied to graphic imaging
US6919892B1 (en) * 2002-08-14 2005-07-19 Avaworks, Incorporated Photo realistic talking head creation system and method

Also Published As

Publication number Publication date
US7433535B2 (en) 2008-10-07
JP4423298B2 (ja) 2010-03-03
US20050069217A1 (en) 2005-03-31
WO2005034038A1 (en) 2005-04-14
EP1668594A1 (en) 2006-06-14

Similar Documents

Publication Publication Date Title
JP4423298B2 (ja) デジタル画像におけるテキスト状エッジの強調
JP5875637B2 (ja) 画像処理装置、画像処理方法
KR100477656B1 (ko) 디지털 화질 개선 방법 및 장치
US7532767B2 (en) Removing ringing and blocking artifacts from JPEG compressed document images
JP3768052B2 (ja) カラー画像処理方法、カラー画像処理装置、及びそのための記録媒体
US8103104B2 (en) Text extraction and its application to compound document image compression
US8155437B2 (en) Perceptually lossless color compression
US6999619B2 (en) Processing for accurate reproduction of symbols and other high-frequency areas in a color image
US20040096102A1 (en) Methodology for scanned color document segmentation
JP6648580B2 (ja) 原稿種認識装置、画像形成装置、原稿種認識方法およびプログラム
JP2000175051A (ja) デジタル画像デ―タの区分方法並びにデ―タブロックの区分方法及び分類方法
JP2000196895A (ja) デジタル画像デ―タ区分方法
JPH11220632A (ja) 画像処理装置、画像処理方法および画像処理制御プログラムを記録した媒体
JP6743092B2 (ja) 画像処理装置、画像処理の制御方法、及びプログラム
KR100524072B1 (ko) 화질 개선 방법
US7848589B2 (en) Method and apparatus for applying edge enhancement based on image characteristics
US7724981B2 (en) Adaptive contrast control systems and methods
JP4093413B2 (ja) 画像処理装置、画像処理プログラム及び該プログラムを記録した記録媒体
JP6705237B2 (ja) 画像圧縮装置、画像形成装置、画像圧縮方法およびプログラム
JP4441300B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体
JP2004343207A (ja) 画像処理装置、画像処理方法、画像処理プログラム、画像処理プログラムを記録した記録媒体、および画像処理装置を備えた画像形成装置
KR100514734B1 (ko) 디지털 화질 개선방법 및 장치
JP2778669B2 (ja) 網点領域検出方法
JP2003189090A (ja) 画像処理装置及び画像処理方法、画像処理プログラム、記憶媒体
CN115908114A (zh) 黑白漫画风格的二值化图片转化方法、装置、设备和介质

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090407

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090706

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090713

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091001

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091117

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091207

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131211

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees