JPH06339019A - 離散的コサイン変換による文書画像の領域分離方式 - Google Patents
離散的コサイン変換による文書画像の領域分離方式Info
- Publication number
- JPH06339019A JPH06339019A JP5126553A JP12655393A JPH06339019A JP H06339019 A JPH06339019 A JP H06339019A JP 5126553 A JP5126553 A JP 5126553A JP 12655393 A JP12655393 A JP 12655393A JP H06339019 A JPH06339019 A JP H06339019A
- Authority
- JP
- Japan
- Prior art keywords
- coefficient
- character
- picture
- area
- dct
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Facsimile Image Signal Circuits (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Character Input (AREA)
Abstract
(57)【要約】
【目的】 文字と写真領域の高精度かつ高速な分離を実
現すること。 【構成】 イメージスキャナ等の入力装置に入力された
印刷文書に対して、文字領域と写真領域を分離する領域
分離方式において、入力装置から得られたフルカラー文
書画像に対して画像縮小変換を施した後に離散的コサイ
ン変換処理を行ない、前記離散的コサイン変換処理によ
り得られた離散的コサイン変換係数から、文字と写真を
判別することを特徴とする。
現すること。 【構成】 イメージスキャナ等の入力装置に入力された
印刷文書に対して、文字領域と写真領域を分離する領域
分離方式において、入力装置から得られたフルカラー文
書画像に対して画像縮小変換を施した後に離散的コサイ
ン変換処理を行ない、前記離散的コサイン変換処理によ
り得られた離散的コサイン変換係数から、文字と写真を
判別することを特徴とする。
Description
【0001】
【産業上の利用分野】本発明は、文字と写真等が混在す
る文書から文字と写真の領域を分離する方式に関し、特
に、離散的コサイン変換(以下、DCTと称する)を用
いて文字と写真の領域を分離する方式に関する。
る文書から文字と写真の領域を分離する方式に関し、特
に、離散的コサイン変換(以下、DCTと称する)を用
いて文字と写真の領域を分離する方式に関する。
【0002】
【従来の技術】従来の領域分離技術では、フルカラー画
像を2値画像に変換して、画素の連結状態から文字と写
真領域を識別する方式や、フルカラー画像の原画像状態
で画像のテクスチャーを求め、文字と写真の領域を判別
する方式が存在した。後者の代表的なものに、FFT、
フラクタル次元、ウェーブレット変換等を利用したもの
がある。
像を2値画像に変換して、画素の連結状態から文字と写
真領域を識別する方式や、フルカラー画像の原画像状態
で画像のテクスチャーを求め、文字と写真の領域を判別
する方式が存在した。後者の代表的なものに、FFT、
フラクタル次元、ウェーブレット変換等を利用したもの
がある。
【0003】
【発明が解決しようとする課題】従来の技術では、イメ
ージスキャナから取り込んだ画像を、一端、2値化し、
画素の連結状態で文字と写真を判別するものと、フルカ
ラーのままで、文書画像のテクスチャーから文字と写真
の判別は実行されている。テクスチャー解析に通用され
る手法としては、フーリエ変換、フラクタル次元、K−
L変換、ウェーブレット変換等を応用した領域分離方式
があるが、いずれも変換に時間がかかるという問題点が
ある。
ージスキャナから取り込んだ画像を、一端、2値化し、
画素の連結状態で文字と写真を判別するものと、フルカ
ラーのままで、文書画像のテクスチャーから文字と写真
の判別は実行されている。テクスチャー解析に通用され
る手法としては、フーリエ変換、フラクタル次元、K−
L変換、ウェーブレット変換等を応用した領域分離方式
があるが、いずれも変換に時間がかかるという問題点が
ある。
【0004】本発明は上述したような従来の技術が有す
る問題点に鑑みてなされたものであってDCTを用いる
ことにより、文字と写真領域の高精度かつ高速な分離を
実現することを目的とする。
る問題点に鑑みてなされたものであってDCTを用いる
ことにより、文字と写真領域の高精度かつ高速な分離を
実現することを目的とする。
【0005】
【課題を解決するための手段】本発明の離散的コサイン
変換による文書画像の領域分離方式は、イメージスキャ
ナ等の入力装置に入力された印刷文書に対して、文字領
域と写真領域を分離する領域分離方式において、入力装
置から得られたフルカラー文書画像に対して画像縮小変
換を施した後に離散的コサイン変換処理を行ない、離散
的コサイン変換処理により得られた離散的コサイン変換
係数から、文字と写真を判別することを特徴とする。
変換による文書画像の領域分離方式は、イメージスキャ
ナ等の入力装置に入力された印刷文書に対して、文字領
域と写真領域を分離する領域分離方式において、入力装
置から得られたフルカラー文書画像に対して画像縮小変
換を施した後に離散的コサイン変換処理を行ない、離散
的コサイン変換処理により得られた離散的コサイン変換
係数から、文字と写真を判別することを特徴とする。
【0006】
【作用】本発明は、最近、カラー画像符号化方式で注目
されているDCTをテクスチャー解析に適応させ、領域
分離を実現するために、まず、与えられた文書画像の縮
小手段を採用し、さらに、DCT係数の中から文字と写
真を特徴付ける係数に着眼して、着眼した特徴係数の統
計的性質から算出した評価関数をもとに各ブロック毎に
文字、写真領域を判別し、写真領域を矩形状に抽出する
ことを最も主要な特徴とする。
されているDCTをテクスチャー解析に適応させ、領域
分離を実現するために、まず、与えられた文書画像の縮
小手段を採用し、さらに、DCT係数の中から文字と写
真を特徴付ける係数に着眼して、着眼した特徴係数の統
計的性質から算出した評価関数をもとに各ブロック毎に
文字、写真領域を判別し、写真領域を矩形状に抽出する
ことを最も主要な特徴とする。
【0007】画像縮小変換が行われた画像については、
文字画像と写真画像の各DCT係数特性に明確な差異が
認められる。本発明では、縮小画像についてDCT処理
が施されるので、領域分離が良好に行われる。
文字画像と写真画像の各DCT係数特性に明確な差異が
認められる。本発明では、縮小画像についてDCT処理
が施されるので、領域分離が良好に行われる。
【0008】
【実施例】以下、図を用いて本発明の実施例を説明す
る。
る。
【0009】図1は、本発明の全休的な構成図であり、
図2,図3は、本発明の詳細な構成を示す図である。
図2,図3は、本発明の詳細な構成を示す図である。
【0010】各図に示すように、画像入力部101(入
力装置202)に入力された文字、写真が混在する印刷
文書201は、RGBの24ビット(それぞれ8ビット
ずつ)のフルカラー画像203として格納される。
力装置202)に入力された文字、写真が混在する印刷
文書201は、RGBの24ビット(それぞれ8ビット
ずつ)のフルカラー画像203として格納される。
【0011】この後、格納されたフルカラー画像203
は、縮小変換処理102によって1/2、または、1/
3縮小変換が施されて縮小画像204とされ、さらに、
輝度画像作成部104でのYIQ変換処理103によっ
てY成分205が求められる。なお、本実施例では上記
のようにY成分を用いて輝度成分を表す情報としたが、
この他に、Y,Cr,Cb、CIE(1976)L*a*
b*を色空間として輝度成分を表す情報を採用しても構
わない。
は、縮小変換処理102によって1/2、または、1/
3縮小変換が施されて縮小画像204とされ、さらに、
輝度画像作成部104でのYIQ変換処理103によっ
てY成分205が求められる。なお、本実施例では上記
のようにY成分を用いて輝度成分を表す情報としたが、
この他に、Y,Cr,Cb、CIE(1976)L*a*
b*を色空間として輝度成分を表す情報を採用しても構
わない。
【0012】本発明は、このY成分205に対してDC
T処理105(DCTブロックは一辺が8画素の正方形
である)を施し、計数解析部106にて64個のDCT
係数の中から、図4に示すように、係数群から文字と写
真を判別するための係数値を求める。本実施例において
は、縮小画像の係数特性に合わせて図3に示すDC係数
と高周波係数との絶対和を特徴係数とした。DC係数は
特に背景色の(とくに白)の影響を大きく受け、写真画
像のそれよりも大きな値をとる。また、図4中の斜線で
示した高周波成分は細かい変化の覆い文字部において分
散が大きく、再生において重要な部分である。
T処理105(DCTブロックは一辺が8画素の正方形
である)を施し、計数解析部106にて64個のDCT
係数の中から、図4に示すように、係数群から文字と写
真を判別するための係数値を求める。本実施例において
は、縮小画像の係数特性に合わせて図3に示すDC係数
と高周波係数との絶対和を特徴係数とした。DC係数は
特に背景色の(とくに白)の影響を大きく受け、写真画
像のそれよりも大きな値をとる。また、図4中の斜線で
示した高周波成分は細かい変化の覆い文字部において分
散が大きく、再生において重要な部分である。
【0013】本実施例では、特徴係数を上記のように定
義したことにより、背景画像を含んだ文字領域と写真領
域との分離を高品質で行うことが可能となっている。
義したことにより、背景画像を含んだ文字領域と写真領
域との分離を高品質で行うことが可能となっている。
【0014】次に、領域判別部107にて予め解析的に
導出しておいた判別評価関数をもとに、文字と写真領域
を判別処理する。
導出しておいた判別評価関数をもとに、文字と写真領域
を判別処理する。
【0015】本発明では、2次元の(線形)判別関数を
適用したが、さらに、重要係数と考えられる係数との組
み合わせによって、n次元に拡張し、それから評価関数
を求めることも可能である。尚、本実施例で使用した
(線形)判別関数は、以下の手順に従って求めた。
適用したが、さらに、重要係数と考えられる係数との組
み合わせによって、n次元に拡張し、それから評価関数
を求めることも可能である。尚、本実施例で使用した
(線形)判別関数は、以下の手順に従って求めた。
【0016】
【数1】 第(1)式に示すものが、文字画像と写真画像を判別す
る評価関数である。従って、文字と写真の領域判別は、
各ブロックのDCT係数を求め、第(1)式のxとyに
特徴係数値を代入して、左辺の値がM未満ならば写真領
域、M以下ならば文字領域と判別する。この判別処理
は、全ブロックについて実行される。
る評価関数である。従って、文字と写真の領域判別は、
各ブロックのDCT係数を求め、第(1)式のxとyに
特徴係数値を代入して、左辺の値がM未満ならば写真領
域、M以下ならば文字領域と判別する。この判別処理
は、全ブロックについて実行される。
【0017】次に、矩形領域の抽出方法について説明す
る。抽出処理は、判別後の領域補正(画像補正)を含む
ものであり、詳細な構成を図3に示す。
る。抽出処理は、判別後の領域補正(画像補正)を含む
ものであり、詳細な構成を図3に示す。
【0018】図3に示すように、評価関数により「写真
領域」と判別された場合、写真領域の周辺、及び、内部
において、文字領域と判別されたブロックが存在し、場
合によっては矩形的でない。そこで、画像補正部108
にて図5に示すような隣接する領域を用いた補正処理に
より、領域内部を補正する。
領域」と判別された場合、写真領域の周辺、及び、内部
において、文字領域と判別されたブロックが存在し、場
合によっては矩形的でない。そこで、画像補正部108
にて図5に示すような隣接する領域を用いた補正処理に
より、領域内部を補正する。
【0019】次に、個々の領域を矩形状に抽出するため
に、ラベリングを行ない、図6に示すような各領域の縦
横の座標の最大値と最小値を検出する。最後に、この座
標に従って矩形的に領域を抽出し、画像出力部109よ
り出力する。
に、ラベリングを行ない、図6に示すような各領域の縦
横の座標の最大値と最小値を検出する。最後に、この座
標に従って矩形的に領域を抽出し、画像出力部109よ
り出力する。
【0020】なお、図6に示したように領域を矩形的に
抽出するのは、この後行われる構造的符号化を容易とす
るためであり、以後の処理が異なるものである場合には
処理内容に応じて変更してもよく、特に重要なものでは
ない。
抽出するのは、この後行われる構造的符号化を容易とす
るためであり、以後の処理が異なるものである場合には
処理内容に応じて変更してもよく、特に重要なものでは
ない。
【0021】
【発明の効果】以上説明したように、木発明によれば、
文字と写真が混在する文書画像に対して、文字領域(背
景領域を含んだ領域)と写真領域の高品質な領域分離を
高速に行うことが可能となる。
文字と写真が混在する文書画像に対して、文字領域(背
景領域を含んだ領域)と写真領域の高品質な領域分離を
高速に行うことが可能となる。
【図1】本発明の概略動作を示す図である。
【図2】本発明の判別処理までの構成図である。
【図3】本発明の判別処理以降の構成図である。
【図4】各ブロックで求めた64個のD印係数の中か
ら、文字と写真を判別するために利用する重要係数を示
した図であリ、各格子はDCT係数F(m,n)に対応
している。
ら、文字と写真を判別するために利用する重要係数を示
した図であリ、各格子はDCT係数F(m,n)に対応
している。
【図5】画像補正に利用した穴埋め処理を示す図であ
る。
る。
【図6】補正された写真領域を矩形的に抽出する処理の
説明図である。
説明図である。
101 画像入力部 102 縮小変換処理 103 YIQ変換処理 104 輝度画像作成部 105 DCT変換処理 106 係数解析部 107 領域判別部 108 画像補正部 109 画像出力部 201 文字、写真混在文書 202 入力装置 203 フルカラー画像 204 縮小画像 205 Y成分 206 評価関数
Claims (1)
- 【請求項1】 イメージスキャナ等の入力装置に入力さ
れた印刷文書に対して、文字領域と写真領域を分離する
領域分離方式において、 入力装置から得られたフルカラー文書画像に対して画像
縮小変換を施した後に離散的コサイン変換処理を行な
い、 前記離散的コサイン変換処理により得られた離散的コサ
イン変換係数から、文字と写真を判別することを特徴と
する離散的コサイン変換による文書画像の領域分離方
式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5126553A JPH06339019A (ja) | 1993-05-28 | 1993-05-28 | 離散的コサイン変換による文書画像の領域分離方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5126553A JPH06339019A (ja) | 1993-05-28 | 1993-05-28 | 離散的コサイン変換による文書画像の領域分離方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH06339019A true JPH06339019A (ja) | 1994-12-06 |
Family
ID=14938023
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP5126553A Pending JPH06339019A (ja) | 1993-05-28 | 1993-05-28 | 離散的コサイン変換による文書画像の領域分離方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH06339019A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0852041A1 (en) * | 1995-09-14 | 1998-07-08 | Bently Mills, Inc. | Method and systems for manipulation of images of floor coverings or other fabrics |
US6865290B2 (en) | 2000-02-09 | 2005-03-08 | Ricoh Company, Ltd. | Method and apparatus for recognizing document image by use of color information |
US7239748B2 (en) | 2003-08-12 | 2007-07-03 | International Business Machines Corporation | System and method for segmenting an electronic image |
WO2008139825A1 (ja) * | 2007-05-08 | 2008-11-20 | Olympus Corporation | 画像処理装置および画像処理プログラム |
WO2009104315A1 (ja) * | 2008-02-21 | 2009-08-27 | オリンパス株式会社 | 画像処理装置、画像処理方法および画像処理プログラム |
US8218863B2 (en) | 2008-01-30 | 2012-07-10 | Ricoh Company, Ltd. | Image processing apparatus, image processing method and image processing means |
-
1993
- 1993-05-28 JP JP5126553A patent/JPH06339019A/ja active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0852041A1 (en) * | 1995-09-14 | 1998-07-08 | Bently Mills, Inc. | Method and systems for manipulation of images of floor coverings or other fabrics |
EP0852041A4 (en) * | 1995-09-14 | 2001-01-10 | Bently Mills Inc | METHODS AND SYSTEMS FOR HANDLING IMAGES OF FLOOR COVERINGS OR OTHER TISSUES |
US6865290B2 (en) | 2000-02-09 | 2005-03-08 | Ricoh Company, Ltd. | Method and apparatus for recognizing document image by use of color information |
US7239748B2 (en) | 2003-08-12 | 2007-07-03 | International Business Machines Corporation | System and method for segmenting an electronic image |
WO2008139825A1 (ja) * | 2007-05-08 | 2008-11-20 | Olympus Corporation | 画像処理装置および画像処理プログラム |
US8218863B2 (en) | 2008-01-30 | 2012-07-10 | Ricoh Company, Ltd. | Image processing apparatus, image processing method and image processing means |
WO2009104315A1 (ja) * | 2008-02-21 | 2009-08-27 | オリンパス株式会社 | 画像処理装置、画像処理方法および画像処理プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6633670B1 (en) | Mask generation for multi-layer image decomposition | |
US6650773B1 (en) | Method including lossless compression of luminance channel and lossy compression of chrominance channels | |
US8331671B2 (en) | Image processing apparatus and image encoding method related to non-photo image regions | |
US7340092B2 (en) | Image processing device, image processing method, program for executing image processing, and computer readable recording medium on which the program is stored | |
JP2003228712A (ja) | イメージからテキスト状のピクセルを識別する方法 | |
JP3972751B2 (ja) | 画像処理装置 | |
US8395813B2 (en) | Subtractive color method, subtractive color processing apparatus, image forming apparatus, and computer-readable storage medium for computer program | |
US9384519B1 (en) | Finding similar images based on extracting keys from images | |
US7672008B2 (en) | Image processing device, method and program product for separating character, halftone graphic, and halftone photographic regions | |
WO2001063558A2 (en) | System and method for image processing | |
JP2003179738A (ja) | 画像処理装置 | |
EP1103918A2 (en) | Image enhancement on JPEG compressed image data | |
US8411940B2 (en) | Method for fast up-scaling of color images and method for interpretation of digitally acquired documents | |
JPH06339019A (ja) | 離散的コサイン変換による文書画像の領域分離方式 | |
US20040257625A1 (en) | Apparatus for, method of, and system for image processing | |
JP4441300B2 (ja) | 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体 | |
JP3899872B2 (ja) | 画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体 | |
JP4116377B2 (ja) | 画像処理方法および画像処理装置 | |
JP2001222717A (ja) | 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体 | |
JP2004242075A (ja) | 画像処理装置および方法 | |
Papamarkou et al. | Conversion of color documents to grayscale | |
JP4228905B2 (ja) | 画像処理装置及びプログラム | |
JP3030126B2 (ja) | 画像処理方法 | |
JP2005020413A (ja) | 画像処理装置、画像処理方法およびその方法をコンピュータに実行させるためのプログラム | |
JP2005323066A (ja) | 画像処理装置 |