JP4351411B2 - 画素を分類するための方法およびシステム - Google Patents
画素を分類するための方法およびシステム Download PDFInfo
- Publication number
- JP4351411B2 JP4351411B2 JP2002025575A JP2002025575A JP4351411B2 JP 4351411 B2 JP4351411 B2 JP 4351411B2 JP 2002025575 A JP2002025575 A JP 2002025575A JP 2002025575 A JP2002025575 A JP 2002025575A JP 4351411 B2 JP4351411 B2 JP 4351411B2
- Authority
- JP
- Japan
- Prior art keywords
- image element
- closed
- image
- perimeter
- length
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 68
- 230000006835 compression Effects 0.000 claims description 17
- 238000007906 compression Methods 0.000 claims description 17
- 230000002093 peripheral effect Effects 0.000 claims 2
- 238000010586 diagram Methods 0.000 description 11
- 238000009877 rendering Methods 0.000 description 3
- 239000003086 colorant Substances 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000026676 system process Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/20—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Image Analysis (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
【発明の属する技術分野】
本発明は、一般に画像処理に関し、より詳細には、画像要素を分類するための方法、システム、および機械可読媒体に関する。
【0002】
【従来の技術】
多くの画像が、画像のピクセルに基づく表現を利用しないコンピュータ化された方法を使用して生成されている。例えば、テキスト処理ソフトウェアは、テキスト、フォント、カラー、組込み画像などの画像の高レベル要素を記述する構造化されたページ情報を使用して画像を表す。この構造化されたページ情報には、MSWord(商標)docファイル、Adobe(商標)PDFファイル、またはPostScript(商標)ファイルなどの多種多様なファイル形式がある。情報は、印刷される、または他の仕方でレンダリングされる際、画像を増分式に構成する一連のオーバーレーされる画像要素に変換される可能性がある。
【0003】
しばしば、これらの画像を圧縮、すなわち、符号化する必要が存在する。一般に、画像要素は、まず、何らかの分類基準に基づいて前景または背景に分類される。分類の後、前景がより高い解像度で符号化される。というのは、それが関心の要素を含むからである。他方、背景は、通常、より低い解像度で符号化される。というのは、それがより関心の低い要素を含むからである。そのような符号化戦略は、当技術分野では周知のものであり、例えば、MPEG、JPEG等である。したがって、要素分類の品質が、これらの画像の圧縮比およびビデオ品質に大きく影響することになる。このため、分類を効果的に行うことが重要である。
【0004】
構造化されたページ情報からレンダリングされる画像に関する現行の要素分類手法は、画像内のすべてのテキストを前景として、また他のすべての詳細を背景として分類するステップと、すべての単色要素を前景として、また他のすべての要素を背景として分類するステップと、および描かれる第1の要素を背景として、またすべての他の要素を前景として分類するステップとを含む。ただし、これらの手法のすべてが効果的ではなく、特に地理的な地図に関してはそうである。とうのは、関心の要素が、ときとして、実際には前景要素であるにも関わらず、背景分類のための基準を満たすようにレンダリングされるからである。この結果、これらの関心の要素が、誤ってより低い解像度で符号化される。このため、これらの要素の圧縮効率およびビデオ品質が相当に低下する。
【0005】
したがって、当技術分野において、一般に、画像要素を分類する、また特に、構造化されたページ情報、例えば、電子文書からレンダリングされる画像要素を分類する効果的な方策の必要性が存在する。
【0006】
【発明が解決しようとする課題】
本発明は、複数のカテゴリのうち1つとして画像要素を分類するための方法を提供する。この方法は、画像要素の閉じられない周囲長と、他の画像要素によって閉じられた画像要素の周囲長との比に基づいて画像要素を分類するステップを含む。その後、画像要素は、その画像要素がそこに分類されたカテゴリと関連する符号化スキームに従って符号化されることが可能である。
【0007】
【課題を解決するための手段】
本発明の実施形態は、要素の閉じられない周囲長(開区間長、以下同じ)と、要素の閉じられた周囲長(閉区間長、以下同じ)との比に基づき、複数のカテゴリのうち1つとして画像要素を分類するための技法を提供する。画像要素の閉じられた周囲長は、通常、他の画像要素がその要素の上にオーバーレーされているとき、その要素の閉じられない周囲長とは異なる。したがって、この比は、どれだけ画像要素が他の画像要素によってブロックされているかという量の良好な見積りを提供することができる。符号化の誤りを高い度合いで閉じられた画像要素に「プッシュする」ことにより、高い度合いで圧縮された画像の知覚される品質を効果的に向上させることができる。
【0008】
【発明の実施の形態】
本発明は、画像要素が前景層と背景層のうち1つに属するものとして分類されることが可能な画像圧縮に適用することができる。図1Aは、本発明を実現する画像圧縮システムのブロック図である。このシステムは、レンダリング・エンジン10と、分類器20と、前景コーダ30と、背景コーダ40とを含む。レンダリング・エンジン10は、圧縮されるべき画像を生成する。レンダリング・エンジン10は、印刷ドライバまたはテキスト処理ソフトウェアであることが可能であるが、それらには限定されない。分類器20は、画像要素を前景要素または背景要素として分類することによって画像を処理する。前景として分類された要素は、任意の符号化技法に従って前景コーダ30によって符号化されることが可能である。同様に、背景として分類された要素は、任意の符号化技法に従って背景コーダ40によって符号化されることが可能である。例としての符号化技法は、当技術分野では周知のものである。そのような技法は、独立に使用すること、または、例えば、L.Bottou他による「Journal of Electronic Imaging,7(3):410−425,1998」掲載の「High Quality Document Image Compression with DjVu」に記載される符号化技法と併せて使用することが可能である。通常、前景符号化技法および背景符号化技法は、画像品質の損失がより少なく前景画像要素が圧縮されるように選択することになる。他方、背景画像要素は、より高い圧縮で符号化され、画像品質の損失が比較的高くなることになる。
【0009】
画像圧縮の用途は、単に、実施例としてのものであり、画像要素分類が行われるようなどの用途でも本発明を使用できることを理解されたい。さらに、カテゴリの数は2つに限られないことも理解されたい。
【0010】
実施例としての画像圧縮では、画像要素の閉じられない周囲長と閉じられた周囲長との比が低いことは、その要素が背景層に属するものとして分類されている場合、その要素の境界に関するどのような符号化の誤りも、他の閉塞を行う要素によって前景層から覆い隠される可能性が高いのを示している可能性がある。したがって、その符号化の誤りは、気が付かれる可能性が低い。これとは対照的に、画像要素の閉じられない周囲長と閉じられた周囲長との比が高いことは、その境界に関する符号化の誤りが認識される可能性が高いのを示している可能性がある。というのは、それらの誤りが他の要素によって覆い隠されないからである。この場合、その要素を前景層に符号化することが適切である可能性がある。したがって、本発明は、圧縮画像のより高い圧縮比と向上した視覚的品質を提供する。
【0011】
前景要素を符号化するためのビット数は、その要素の可視部分(すなわち、他の要素によって閉じられた要素形状部分を除去した後の)の周囲長Poccludedに正比例することが可能である。前景要素による閉塞から生じる背景要素の縁は、閉塞を行う前景要素の境界によって規定される可能性がある。したがって、背景要素を符号化するためのビット数は、前景要素の一部として既に符号化されている可能性がある背景要素の閉じられた部分を除外することによって減少させることができる。したがって、背景要素を符号化するためのビット数は、前景要素による閉塞から生じたものではない周囲セグメントの長さPunoccludedに正比例することが可能である。さらに、比例係数は、要素の境界上の色差に依存する。
【0012】
図1Bは、本発明の実施形態による方法の流れ図である。本発明によれば、画像分類システムは、画像要素の閉じられない周囲長Punoccluded(100)、および他の画像要素によって閉じられたときのその画像要素の周囲長Poccluded(110)を計算する。システムは、これらの計算した値の比を所定のしきい値T(120)と比較する。
PunoccludedのPoccludedに対する比がこのしきい値を超える場合には、システムは、その画像要素を前景要素(140)に属するものとして分類する。そうでなければ、システムは、その画像要素を背景要素(130)に属するものとして分類する。実施例としてのしきい値Tは、80%である。次に、システムは、要素分類(150)に基づき、前景符号化スキームまたは背景符号化スキームを使用して画像要素を符号化する。
【0013】
オプションとして、システムは、何らかの所定タイプの画像要素を前景層または背景層に割り当てる。例えば、システムは、前景層にテキストまたは記号を事前割当てすることができる。前景はより高い解像度で符号化することができるので、テキストおよび記号を前景として符号化することにより、それらの可読性が向上する。
【0014】
本発明のすべてまたはその部分は、いくつかの態様がオプションであるため、画像要素を分類するための他の方法と関連して使用することができる。例えば、テキストが前景層に自動的に割り当てられることが可能な場合、本方法をテキスト画像要素に適用する必要はない。
【0015】
本発明によって処理される画像要素は、画像要素の構成要素および画像内のその座標を記述する構造化されたページ情報として最初に表現されることが可能である。これらの構成要素のほとんどは、「長方形を塗りつぶす」、「線を描く」、または「テキストを描く」などの簡単な動作である。これらの動作は、単に、要素形状と呼ばれる一組の指定された部分に単一カラーを割り当てる。後の動作が、前の動作によって生成された画像データに上書きする可能性がある。印刷動作により、それが完了したとき、完成した印刷出力(しばしば、ページである)がレンダリングされる。
【0016】
本発明において、システムは、その構造化されたページ情報から画像要素を処理し、画像要素座標が読み取られ、前景層および背景層と比較されるようにする。この比較から、システムは、画像要素の閉じられた部分を判定する。次に、システムは、画像要素を前景層または背景層にレンダリングする。
【0017】
図2は、画像要素周囲長を計算するための実施例としての方法の流れ図である。本方法は、前景層および背景層と画像要素形状の間でいくつかのブール演算を行う。この実施形態では、これらの層および形状は、ランレングス符号化を使用して表現することができる。ランレングス符号化では、層および画像要素の各走査線(または行)が、黒のビットと白のビットの連続するランを記述する一連の長さによって表される。ランは、走査線の左から右への走査において遭遇する隣接する一群の0(白のビット)または1(黒のビット)である。実施例として、黒のビットは画像要素を表し、また白のビットは非要素空間を表す。したがって、システムは、「黒のビット」のランに対して単一回のパスを行い、層または要素形状の各走査線を左から右に走査することにより、ランレングス符号化された層または要素形状の周囲長を計算する(200)。
【0018】
各「黒のビット」のランごとに、システムは、ランの長さの2倍、すなわち、ビット数および幅の2倍を加算することによってランの周囲長rを計算する(205)。長さの値および幅の値は、それぞれ、頂部の長さおよび底部の長さ、ならびに端部の幅を計算に入れるため、2倍にする。次に、システムは、ランと次の走査線内の隣接するラン、すなわち、ランに隣接し、同一の層または同一の要素形状の一部である次の走査線内のラン・ビットの間の各接触セグメントの長さlを計算する(210)。
【0019】
すべてのランを処理した後、システムは、すべての周囲長rを合計してRを生成し、またすべての接触の長さlを合計してLを生成する(220)。隣接するランの周囲長は、同じ接触の長さを含むので、システムは、合計Lを2倍にして、重複する包含を計算に入れる。システムは、層または要素形状の周囲長をP=R−2Lとして計算する(230)。
【0020】
図3は、実施例としての画像要素に関する図2の周囲長の計算を示している。この実施例では、画像要素300は、5つの走査線から構成されている。各走査線は、第3の走査線を例外として、単一の「黒のビット」のランを有している。第3の走査線は、「白のビット」のランによって隔てられた2つの「黒のビット」のランを有している。システムは、各「黒のビット」のラン310の周囲長rを判定する。次に、システムは、ラン310の周囲長rの合計Rを計算する。システムは、隣接するランの間における接触セグメント320を検出し、それらすべての長さlを合計し、その合計を2倍にして2Lを生成する。画像要素300の周囲長Pは、R−2Lに等しい。
【0021】
他の技法によって計算された周囲長も本発明によって使用されることが可能であるので、この周囲長計算は、単に、実施例としてのものであることを理解されたい。そのような技法には、輪郭マッピング法および領域成長法が含まれるが、それらには限定されない。
【0022】
図4は、画像要素の閉じられない部分と閉じられた部分を検出するための実施例としての方法を示し、これらの部分に関してシステムが、例えば、図2の方法を使用して周囲長を計算して、画像要素を前景層または背景層に属するものとして分類するようにする。第1に、システムは、2つの空の層FおよびBを作成して、前景または背景として分類されるべき画像要素を表す。次に、システムは、一番上の要素から開始して一番下の要素に向って進み、すべての画像要素に対して以下のことを行う。
【0023】
システムは、画像要素の周囲長Poriginalを計算する(400)。これは、閉塞がないときに画像要素が見せることになる画像要素の元の形状の周囲長である。次に、システムは、現在の画像要素上に描かれた背景画像要素によって閉じられた画像要素形状の部分を判定する(405)。これは、画像要素形状と現在の背景Bの交差を計算することによって達せられる。例えば、所与の画像要素部分iに関して、現在の背景部分B(i)がある値を有する場合には、その画像要素部分iは、閉じられたものとして指定され、除去される。
【0024】
処理される第1の画像要素に関しては、すなわち、一番上の要素に関しては、背景Bは空であり、したがって、除去すべき閉じられた部分は全く存在しない。後続の要素に関しては、背景が前に処理された閉塞を行う要素を含む場合、システムが閉じられた部分を画像要素形状から除去する(410)。
【0025】
次に、システムは、現在の画像要素上に描かれる前景画像要素によって閉じられる合成要素形状の部分を判定する(420)。これは、画像要素形状と現在の前景Fの交差を計算することによって達せられる。例えば、所与の画像要素部分iに関して、現在の前景部分F(i)がある値を有する場合には、その画像要素部分iは、閉じられたものとして指定され、除去される。
【0026】
処理される第1の画像要素に関しては、すなわち、一番上の要素に関しては、前景Fは空であり、したがって、除去すべき閉じられた部分は全く存在しない。後続の要素に関しては、前景が前に処理された閉塞を行う要素を含む場合、システムが閉じられた部分を画像要素形状から除去する(425)。次に、システムは、前景要素および背景要素によって閉じられる部分の周囲長Pocclusionを計算する(430)。
【0027】
合成画像要素形状は、画像要素の可視部分だけを含む。次に、システムは、その要素の閉じられた周囲長Poccludedおよびその要素の閉じられない周囲長Punoccludedを計算し(440)、ただし、
Poccluded=R−2L (2)
前述したとおり、可視部分の周囲長。そして、
可視境界の周囲長、ただし、閉じられた周囲長と元の周囲長の合計は、画像要素の閉じられない周囲長を2倍にしたものに、除去された閉じられた部分の周囲長を足したものに等しい。
【0028】
図5A−5Cは、本発明の方法に従って検出された画像要素の例としての閉じられた部分と閉じられない部分を示している。図5Aは、「ab」画像要素710によって閉じられた多角形画像要素700を示している。多角形700の閉じられた周囲長Poccluded、すなわち、その閉じられた部分が除去されている可視部分の周囲長を図5Bに示している。多角形700の閉じられない周囲長Punoccluded、すなわち、非連続の可視境界(実線で示す)を図5Cに示している。
【0029】
図6は、多角形700の閉じられない周囲長を判定するのに使用する数式(3)を示している。元の周囲長Poriginalと閉じられた周囲長Poccludedの合計は、閉じられない周囲長Punoccludedを2倍にしたものに、閉じられた部分の周囲長Pocclusionを足したものに等しい。
【0030】
画像要素の閉じられない部分と閉じられた部分を検出するためのこの方法は、この方法の多くの変形形態が本発明によって使用されることが可能であるため、単に実施例としてのものであることを理解されたい。
【0031】
オプションとして、その比に色差δを含めることができる。
【0032】
色差を使用して、画像要素のカラーが背景のカラーとどれほどよく一致するかを判定することができる。それらのカラーがよく一致する場合には、その画像要素の縁はあまり明確ではなく、したがって、その要素が背景に属している可能性が高い。
【0033】
一般に、画像要素上における複数回のパスを使用して、その要素が前景に属するか、または背景に属するかを判定する。これを行うのは、現在の要素の下に位置する要素が、背景要素ではなく、前景要素であると判明する可能性があり、これにより、現在の要素の周囲長に影響を与える可能性があるからである。本発明では、色差の計算により、現在の要素が背景に割り当てられている可能性を推定することができ、これにより、画像要素上における単一回のパスで、その要素が前景であるべきか、背景であるべきかを判定することができるようになる。
【0034】
色差の計算は非常に高価であるので、2つの実施例としての単純化を使用することができる。図7Aが、第1の実施例の流れ図である。システムは、要素境界と隣接する背景要素のそれぞれとの間の色差を計算する(500)。次に、システムは、これらの色差のうち最大のものをδとして選択する(510)
【0035】
図7Bは、第2の実施例を示している。システムは、所定の数の背景要素を選択する(550)。システムは、背景要素の全体のサイズおよび形状に応じて画像要素上における予備パス中に、これらの背景要素をヒューリスティックに判定する。つまり、そのバウンディング・ボックス(すなわち、要素のまわりの想像上の境界)に比べて大きい面積を有し、また現在の画像要素と重なり合う面積が大きい、ソリッド長方形などの画像要素は、背景である可能性がある要素である。このため、色差を計算するのに、その画像要素を使用することができる。反対に、バウンディング・ボックスに比べて小さい面積を有し、また現在の画像要素と重なり合う面積が小さい、長く薄い曲線などの画像要素は、背景である可能性がある要素ではない。このため、色差を計算するのに、その画像要素を使用することはできない。
【0036】
システムは、背景要素を選択した後、選択した隣接する背景要素のそれぞれと要素境界との間の色差を計算する(560)。次に、システムは、それらの色差をδとして平均する(570)。
【0037】
色差を計算するための説明した方法は、色差を計算する多くの技法を本発明において使用することができるため、単に実施例としてのものであることを留意されたい。そのような技法には、階調度測定が含まれるが、それには限定されない。
【0038】
図8は、本発明の別の実施形態による方法の流れ図である。本発明によれば、画像分類システムが、前景層Fおよび背景層Bを空に初期設定する(580)。次に、システムは、各画像要素を反復して分類する(582)。
【0039】
各画像要素ごとに、システムは以下のことを行う。システムは、前景層および背景層と交差する画像要素の部分を判定し(583)、次に、その交差する部分をその画像要素の閉じられた部分として識別して、それらの部分を除去する(584)。次に、システムは、画像要素の閉じられない周囲長Punoccludedを計算し(585)、また画像要素の閉じられた周囲長Poccludedを計算する(586)。システムは、数式(1)のとおり、これらの計算した周囲長の比を所定のしきい値Tに対して比較する(587)。PunoccludedのPoccludedに対する比がこのしきい値を超える場合には、システムは、その画像要素を前景層に属するものとして分類する(589)。そうでなければ、システムは、その画像要素を背景層に属するものとして分類する(588)。実施例としてのしきい値Tは、80%である。オプションとして、システムは、数式(4)のとおり、この比に色差を含める。
【0040】
すべての画像要素を分類した後、システムは、次に、前景層および背景層をそのそれぞれの符号化スキームを使用して符号化する(590)。
【0041】
図9は、本発明に従ってセグメント化することができる実施例としての電子的に生成された画像を示している。システムは、画像600を互いに重なって描かれた一連の基本画像要素610ないし655に分解し、ここで、この順序列の前610と後ろ655は、この順序列内の一番上の画像要素および一番下の画像要素をそれぞれ示す。つまり、システムは、前の画像要素を最後に、また後ろの画像要素を初めに印刷する。システムは、所与の画像形式を処理する印刷ソフトウェアを使用して、図9に示すとおり、基本画像要素610ないし655を別々に印刷することができる。
【0042】
本発明によれば、システムは、最初に、前景および背景として分類される画像要素を表す空の前景層Fおよび空の背景層Bを準備する。次に、システムは、本発明の方法に従って第1の要素610を処理する。つまり、システムは、例えば、図2の周囲長計算を使用して第1の要素の元の形状の周囲長Poriginalを計算する。次に、システムは、例えば、図4のとおり、現在の画像要素の上に描かれる背景画像要素および前景画像要素によって閉じられる第1の要素形状の部分を判定する。層FおよびBは、この時点では、空であるので、第1の要素のどこも閉じられず、その部分のどれも除去されない。したがって、これらの存在しない閉じられた部分の周囲長Pocclusionはゼロである。
【0043】
次に、システムは、数式(2)および(3)から第1の要素の周囲長Poccludedおよび周囲長Punoccludedを計算する。オプションとして、システムは、例えば、図7Aまたは7Bのどちらかの方法に従って、第1の要素と背景の間の色差を計算することができる。次に、システムは、閉じられた周囲長と閉じられない周囲長の比を計算する。この比に基づき、システムは、例えば、図1Bに示すとおり、前景層または背景層に属するものとして第1の要素を分類する。第1の要素は閉じられないので、閉じられた周囲長と閉じられない周囲長は同じである。したがって、第1の要素は、1という比、または色差があれば、それより高い比を有する。しきい値が80%に設定される場合(すなわち、0.8)には、第1の要素は前景に割り当てられる。次に、システムは、第1の要素を含めるように前景層Fを更新する。
【0044】
要素610、615、620、630、および635によって閉じられる閉じられた画像要素650のケースでは、層FおよびBは、空ではない可能性がある。というのは、要素610ないし645が、要素650に先立って処理され、分類されていることになるからである。したがって、システムは要素650の閉じられた部分を判定し、除去する。要素650の閉じられた周囲長Poccludedは、閉じられない周囲長Punoccludedより大きい可能性がある。このため、これらの周囲長の間の比は、しきい値よりも低い可能性がある。その場合、システムは要素650を背景として分類する。
【0045】
システムは、画像要素610ないし655に対して本発明の方法を繰り返し、これにより、分類された画像要素がもたらされ、次に、これらの要素をシステムが効率的に符号化する。
【0046】
本発明の機構および方法は、本発明の教示に従ってプログラミングされた汎用マイクロプロセッサを使用して実施することができる。したがって、本発明は、本発明による方法を行うためにプロセッサによって実行されることが可能な命令を含む機械可読媒体も含む。この媒体には、フロッピー・ディスク、光ディスク、CD−ROMを含む任意の型のディスク、または電子命令を記憶するのに適した任意の型の媒体が含まれるが、それらには限定されない。
【0047】
図10は、本発明を実施することができるコンピュータ・システムの一実施形態のブロック図である。システム700は、本発明の実施形態により、プロセッサ720と通信するバス710と、システム・メモリ・モジュール730と、記憶装置740とを含むことができるが、それらには限定されない。
【0048】
本発明を実施するのに使用するソフトウェアの構造は、任意の所望の形態をとるのが可能なことを理解されたい。例えば、説明した方法は、単一のプログラム内または複数のプログラム内で実装することができる。
【0049】
前述した教示に照らして、本発明の多くの変更形態および変形形態が可能である。したがって、添付の特許請求の範囲内で、本明細書に具体的に記載したのとは異なる仕方で方法を実施することが可能であることを理解されたい。
【図面の簡単な説明】
【図1A】本発明を実現するシステムを示すブロック図である。
【図1B】本発明の方法の実施形態を示す流れ図である。
【図2】画像要素周囲長を計算するための実施例としてのステップを示す流れ図である。
【図3】図2の方法に従って計算された周囲長の例を示す図である。
【図4】閉じられた周囲長および閉じられない周囲長を計算するための実施例としてのステップを示す流れ図である。
【図5A】図4の方法に従って計算された閉じられた周囲長および閉じられない周囲長の例を示す図である。
【図5B】図4の方法に従って計算された閉じられた周囲長および閉じられない周囲長の例を示す図である。
【図5C】図4の方法に従って計算された閉じられた周囲長および閉じられない周囲長の例を示す図である。
【図6】閉じられない周囲長の計算を示す図である。
【図7A】画像要素の色差を計算するための実施例としてのステップを示す流れ図である。
【図7B】画像要素の色差を計算するための実施例としてのステップを示す流れ図である。
【図8】本発明の方法の別の実施形態を示す図である。
【図9】図1Bまたは8の方法をそれに適用することができる、互いに重なって描かれる一連の基本画像要素として分解された電子的に生成される画像の例を示す図である。
【図10】本発明を実施することができるコンピュータ・システムの一実施形態を示すブロック図である。
Claims (23)
- 画像要素を分類する方法であって、
前記画像要素の開区間長と前記画像要素の閉区間長との比に基づき、前記画像要素を前景層および背景層からなるカテゴリのうち1つとして分類するステップであって、該開区間長が、他の要素によって閉じられていない該画像要素の1以上の部分についての周囲セグメントの長さであり、該閉区間長が該他の要素によって閉じられた要素形状部分を除去した後の該画像要素の可視部分の周囲長である、ステップ、及び
前記カテゴリのうち前記1つと関連する符号化スキームに従って前記画像要素を符号化するステップ
を含む方法。 - 前記閉区間長が、
R−2L
として計算され、ここで、Rは画像要素の各水平走査線の周囲長の合計であり、かつLは各水平走査線と前記画像要素の次の水平走査線との間における接触セグメントの長さの合計である請求項1に記載の方法。 - 前記色差が、前記画像要素と前記少なくとも1つの隣接する画像要素の間における色差のうち最大のものとして計算される請求項4に記載の方法。
- 前記色差が、所定の数の前記少なくとも1つの隣接する画像要素と前記画像要素の間における色差の平均として計算される請求項4に記載の方法。
- 前記比が所定のしきい値を超える場合、画像要素が複数のカテゴリのうち1つとして分類され、そうでなければ、前記画像要素が前記複数のカテゴリのうち別の1つとして分類される請求項1に記載の方法。
- 画像要素を分類する方法であって、
前景層と背景層が交差する前記画像要素の部分を特定するステップ、
前記交差する部分を前記画像要素の閉じられた部分として識別するステップ、
前記閉じられた部分を除去して前記画像要素の形状を決めるステップ、
前記画像要素の開区間長と閉区間長を計算するステップ、
前記画像要素の開区間長と前記画像要素の閉区間長との比に基づき、前記画像要素を前景層及び背景層からなるカテゴリのうち1つとして分類するステップであって、該開区間長が他の要素によって閉じられていない該画像要素の1以上の部分についての周囲セグメントの長さであり、該閉区間長が該他の要素によって閉じられた要素形状部分を除去した後の該画像要素の可視部分の周囲長である、ステップ、及び
前記カテゴリのうち前記1つと関連する符号化スキームに従って前記画像要素を符号化するステップ
を含む方法。 - 前記閉区間長が、
R−2L
として計算され、ここで、Rは画像要素の各水平走査線の周囲長の合計であり、かつLは各水平走査線と前記画像要素の次の水平走査線との間における接触セグメントの長さの合計である請求項8に記載の方法。 - 各画像要素が周囲長を有する電子画像から生成された画像要素を分類する方法であって、
前景層および背景層のそれぞれを空であるように初期設定するステップと、
前記画像要素を前記前景層と前記背景層のうち1つとして反復して分類するステップとを含み、
第i番の画像要素に関して、
前記前景層および前記背景層に属するものとして以前に分類された他の画像要素によって閉じられない画像要素の量を判定するステップと、
前記画像要素の開区間長の閉区間長に対する比が所定のしきい値を超えたとき、前記画像要素を前記前景層に属するものとして分類し、そうでなければ、前記背景層として分類するステップであって、該開区間長は他の要素によって閉じられていない該画像要素の1以上の部分についての周囲セグメントの長さであり、該閉区間長は該他の要素によって閉じられた要素形状部分を除去した後の該画像要素の可視部分の周囲長である、ステップと
を含む方法。 - 複数のカテゴリのうち1つと関連する符号化スキームに従って画像要素を符号化するステップをさらに含む請求項11に記載の方法。
- 複数のカテゴリと関連する符号化スキームがそれぞれ画像圧縮スキームである方法であって、背景層の前記圧縮スキームが、前景層の前記圧縮スキームよりも比較的高い圧縮比と画像損失で符号化された出力を実現する請求項12に記載の方法。
- 前記閉区間長が、
R−2L
として計算され、ここで、Rは画像要素の各水平走査線の周囲長の合計であり、かつLは各水平走査線と前記画像要素の次の水平走査線との間における接触セグメントの長さの合計である請求項13に記載の方法。 - 画像要素を符号化する方法であって、
前記画像要素の開区間長と前記画像要素の閉区間長との比が、しきい値を超えているかどうか判定するステップ、
前記比が前記しきい値を超えている場合、前記画像要素を前景層に属するものとして分類するステップであって、該開区間長が他の要素によって閉じられていない該画像要素の1以上の部分についての周囲セグメントの長さであり、該閉区間長が該他の要素によって閉じられた要素形状部分を除去した後の該画像要素の可視部分の周囲長である、ステップ、
前記比が前記しきい値を下回る、または前記しきい値に等しい場合、前記画像要素を背景層に属するものとして分類するステップ、及び
前記画像要素が前記前景層に属するものとして分類されているか、または前記背景層に属するものとして分類されているかに基づき、前記画像要素を符号化するステップ
を含む方法。 - 前記閉区間長が、
R−2L
として計算され、ここで、Rは画像要素の各水平走査線の周囲長の合計であり、かつLは各水平走査線と前記画像要素の次の水平走査線との間における接触セグメントの長さの合計である請求項16に記載の方法。 - プロセッサによる実行のためのプログラム命令を含む機械可読記憶媒体であって、前記命令は、前記プロセッサによって実行されたとき、開区間長を他の要素によって閉じられていない該画像要素の1以上の部分についての周囲セグメントの長さと定義し、閉区間長を該他の要素によって閉じられた要素形状部分を除去した後の該画像要素の可視部分の周囲長と定義した場合に、前記画像要素の開区間長と前記画像要素の閉区間長との比に基づいて画像要素を前景層及び背景層からなるカテゴリのうち1つに割り当てることを前記プロセッサが行うようにさせる機械可読記憶媒体。
- 前記プロセッサが、前記カテゴリのうち1つと関連する符号化スキームに従って前記画像要素を符号化するようにさらに構成された請求項19に記載の機械可読記憶媒体。
- 前記カテゴリと関連する符号化スキームがそれぞれ画像圧縮スキームである機械可読記憶媒体であって、前記背景層の前記圧縮スキームが、前記前景層の前記圧縮スキームよりも比較的高い圧縮比と画像損失で符号化された出力を実現する請求項20に記載の機械可読記憶媒体。
- 前記閉区間長が、
R−2L
として計算され、ここで、Rは画像要素の各水平走査線の周囲長の合計であり、かつLは各水平走査線と前記画像要素の次の水平走査線との間における接触セグメントの長さの合計である請求項19に記載の機械可読記憶媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US26554401P | 2001-02-01 | 2001-02-01 | |
US60/265544 | 2001-02-01 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003051007A JP2003051007A (ja) | 2003-02-21 |
JP4351411B2 true JP4351411B2 (ja) | 2009-10-28 |
Family
ID=23010895
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002025575A Expired - Fee Related JP4351411B2 (ja) | 2001-02-01 | 2002-02-01 | 画素を分類するための方法およびシステム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP4351411B2 (ja) |
KR (1) | KR100896668B1 (ja) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11213156A (ja) * | 1998-01-29 | 1999-08-06 | Canon Inc | 画像処理装置および方法、記録媒体 |
FR2776798A1 (fr) * | 1998-03-24 | 1999-10-01 | Philips Electronics Nv | Procede de traitement d'images incluant des etapes de segmentation d'une image multidimensionnelle et appareil d'imagerie medicale utilisant ce procede |
JP2000050259A (ja) * | 1998-08-03 | 2000-02-18 | Hitachi Telecom Technol Ltd | 動画像符号化装置および動画像復号装置 |
KR100698334B1 (ko) * | 1999-06-11 | 2007-03-23 | 알테라 코포레이션 | 디지털 이미지 세그먼테이션 방법 및 장치 |
-
2002
- 2002-02-01 JP JP2002025575A patent/JP4351411B2/ja not_active Expired - Fee Related
-
2008
- 2008-07-14 KR KR1020080068214A patent/KR100896668B1/ko not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
JP2003051007A (ja) | 2003-02-21 |
KR100896668B1 (ko) | 2009-05-14 |
KR20080071537A (ko) | 2008-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9830535B2 (en) | Method and system for classifying image elements | |
US7634150B2 (en) | Removing ringing and blocking artifacts from JPEG compressed document images | |
US20040096102A1 (en) | Methodology for scanned color document segmentation | |
JP2003228712A (ja) | イメージからテキスト状のピクセルを識別する方法 | |
US8059895B2 (en) | Image processing apparatus | |
JP4632443B2 (ja) | 画像処理装置及び画像処理方法並びにプログラム | |
JP4364809B2 (ja) | 画像処理装置、画像処理方法、プログラム、及び記録媒体 | |
US7873226B2 (en) | Image encoding apparatus | |
JP4164489B2 (ja) | 文書画像強調方法、装置及びそのための記憶媒体 | |
US8810877B2 (en) | Image processing apparatus, image processing method, and storage medium for eliminating blurring of scanned image | |
JP4351411B2 (ja) | 画素を分類するための方法およびシステム | |
JP2003216957A (ja) | 画素を分類するための方法およびシステム | |
JP4324532B2 (ja) | 画像処理装置および記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050121 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070307 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070607 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070813 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071019 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20071127 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20071221 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090604 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090724 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120731 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130731 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |