JPH06339019A - 離散的コサイン変換による文書画像の領域分離方式 - Google Patents

離散的コサイン変換による文書画像の領域分離方式

Info

Publication number
JPH06339019A
JPH06339019A JP5126553A JP12655393A JPH06339019A JP H06339019 A JPH06339019 A JP H06339019A JP 5126553 A JP5126553 A JP 5126553A JP 12655393 A JP12655393 A JP 12655393A JP H06339019 A JPH06339019 A JP H06339019A
Authority
JP
Japan
Prior art keywords
coefficient
character
picture
area
dct
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5126553A
Other languages
English (en)
Inventor
Isao Miyagawa
勲 宮川
Makoto Matsuki
眞 松木
Hajime Mizumachi
肇 水町
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP5126553A priority Critical patent/JPH06339019A/ja
Publication of JPH06339019A publication Critical patent/JPH06339019A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Facsimile Image Signal Circuits (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 文字と写真領域の高精度かつ高速な分離を実
現すること。 【構成】 イメージスキャナ等の入力装置に入力された
印刷文書に対して、文字領域と写真領域を分離する領域
分離方式において、入力装置から得られたフルカラー文
書画像に対して画像縮小変換を施した後に離散的コサイ
ン変換処理を行ない、前記離散的コサイン変換処理によ
り得られた離散的コサイン変換係数から、文字と写真を
判別することを特徴とする。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字と写真等が混在す
る文書から文字と写真の領域を分離する方式に関し、特
に、離散的コサイン変換(以下、DCTと称する)を用
いて文字と写真の領域を分離する方式に関する。
【0002】
【従来の技術】従来の領域分離技術では、フルカラー画
像を2値画像に変換して、画素の連結状態から文字と写
真領域を識別する方式や、フルカラー画像の原画像状態
で画像のテクスチャーを求め、文字と写真の領域を判別
する方式が存在した。後者の代表的なものに、FFT、
フラクタル次元、ウェーブレット変換等を利用したもの
がある。
【0003】
【発明が解決しようとする課題】従来の技術では、イメ
ージスキャナから取り込んだ画像を、一端、2値化し、
画素の連結状態で文字と写真を判別するものと、フルカ
ラーのままで、文書画像のテクスチャーから文字と写真
の判別は実行されている。テクスチャー解析に通用され
る手法としては、フーリエ変換、フラクタル次元、K−
L変換、ウェーブレット変換等を応用した領域分離方式
があるが、いずれも変換に時間がかかるという問題点が
ある。
【0004】本発明は上述したような従来の技術が有す
る問題点に鑑みてなされたものであってDCTを用いる
ことにより、文字と写真領域の高精度かつ高速な分離を
実現することを目的とする。
【0005】
【課題を解決するための手段】本発明の離散的コサイン
変換による文書画像の領域分離方式は、イメージスキャ
ナ等の入力装置に入力された印刷文書に対して、文字領
域と写真領域を分離する領域分離方式において、入力装
置から得られたフルカラー文書画像に対して画像縮小変
換を施した後に離散的コサイン変換処理を行ない、離散
的コサイン変換処理により得られた離散的コサイン変換
係数から、文字と写真を判別することを特徴とする。
【0006】
【作用】本発明は、最近、カラー画像符号化方式で注目
されているDCTをテクスチャー解析に適応させ、領域
分離を実現するために、まず、与えられた文書画像の縮
小手段を採用し、さらに、DCT係数の中から文字と写
真を特徴付ける係数に着眼して、着眼した特徴係数の統
計的性質から算出した評価関数をもとに各ブロック毎に
文字、写真領域を判別し、写真領域を矩形状に抽出する
ことを最も主要な特徴とする。
【0007】画像縮小変換が行われた画像については、
文字画像と写真画像の各DCT係数特性に明確な差異が
認められる。本発明では、縮小画像についてDCT処理
が施されるので、領域分離が良好に行われる。
【0008】
【実施例】以下、図を用いて本発明の実施例を説明す
る。
【0009】図1は、本発明の全休的な構成図であり、
図2,図3は、本発明の詳細な構成を示す図である。
【0010】各図に示すように、画像入力部101(入
力装置202)に入力された文字、写真が混在する印刷
文書201は、RGBの24ビット(それぞれ8ビット
ずつ)のフルカラー画像203として格納される。
【0011】この後、格納されたフルカラー画像203
は、縮小変換処理102によって1/2、または、1/
3縮小変換が施されて縮小画像204とされ、さらに、
輝度画像作成部104でのYIQ変換処理103によっ
てY成分205が求められる。なお、本実施例では上記
のようにY成分を用いて輝度成分を表す情報としたが、
この他に、Y,Cr,Cb、CIE(1976)L**
*を色空間として輝度成分を表す情報を採用しても構
わない。
【0012】本発明は、このY成分205に対してDC
T処理105(DCTブロックは一辺が8画素の正方形
である)を施し、計数解析部106にて64個のDCT
係数の中から、図4に示すように、係数群から文字と写
真を判別するための係数値を求める。本実施例において
は、縮小画像の係数特性に合わせて図3に示すDC係数
と高周波係数との絶対和を特徴係数とした。DC係数は
特に背景色の(とくに白)の影響を大きく受け、写真画
像のそれよりも大きな値をとる。また、図4中の斜線で
示した高周波成分は細かい変化の覆い文字部において分
散が大きく、再生において重要な部分である。
【0013】本実施例では、特徴係数を上記のように定
義したことにより、背景画像を含んだ文字領域と写真領
域との分離を高品質で行うことが可能となっている。
【0014】次に、領域判別部107にて予め解析的に
導出しておいた判別評価関数をもとに、文字と写真領域
を判別処理する。
【0015】本発明では、2次元の(線形)判別関数を
適用したが、さらに、重要係数と考えられる係数との組
み合わせによって、n次元に拡張し、それから評価関数
を求めることも可能である。尚、本実施例で使用した
(線形)判別関数は、以下の手順に従って求めた。
【0016】
【数1】 第(1)式に示すものが、文字画像と写真画像を判別す
る評価関数である。従って、文字と写真の領域判別は、
各ブロックのDCT係数を求め、第(1)式のxとyに
特徴係数値を代入して、左辺の値がM未満ならば写真領
域、M以下ならば文字領域と判別する。この判別処理
は、全ブロックについて実行される。
【0017】次に、矩形領域の抽出方法について説明す
る。抽出処理は、判別後の領域補正(画像補正)を含む
ものであり、詳細な構成を図3に示す。
【0018】図3に示すように、評価関数により「写真
領域」と判別された場合、写真領域の周辺、及び、内部
において、文字領域と判別されたブロックが存在し、場
合によっては矩形的でない。そこで、画像補正部108
にて図5に示すような隣接する領域を用いた補正処理に
より、領域内部を補正する。
【0019】次に、個々の領域を矩形状に抽出するため
に、ラベリングを行ない、図6に示すような各領域の縦
横の座標の最大値と最小値を検出する。最後に、この座
標に従って矩形的に領域を抽出し、画像出力部109よ
り出力する。
【0020】なお、図6に示したように領域を矩形的に
抽出するのは、この後行われる構造的符号化を容易とす
るためであり、以後の処理が異なるものである場合には
処理内容に応じて変更してもよく、特に重要なものでは
ない。
【0021】
【発明の効果】以上説明したように、木発明によれば、
文字と写真が混在する文書画像に対して、文字領域(背
景領域を含んだ領域)と写真領域の高品質な領域分離を
高速に行うことが可能となる。
【図面の簡単な説明】
【図1】本発明の概略動作を示す図である。
【図2】本発明の判別処理までの構成図である。
【図3】本発明の判別処理以降の構成図である。
【図4】各ブロックで求めた64個のD印係数の中か
ら、文字と写真を判別するために利用する重要係数を示
した図であリ、各格子はDCT係数F(m,n)に対応
している。
【図5】画像補正に利用した穴埋め処理を示す図であ
る。
【図6】補正された写真領域を矩形的に抽出する処理の
説明図である。
【符号の説明】
101 画像入力部 102 縮小変換処理 103 YIQ変換処理 104 輝度画像作成部 105 DCT変換処理 106 係数解析部 107 領域判別部 108 画像補正部 109 画像出力部 201 文字、写真混在文書 202 入力装置 203 フルカラー画像 204 縮小画像 205 Y成分 206 評価関数

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 イメージスキャナ等の入力装置に入力さ
    れた印刷文書に対して、文字領域と写真領域を分離する
    領域分離方式において、 入力装置から得られたフルカラー文書画像に対して画像
    縮小変換を施した後に離散的コサイン変換処理を行な
    い、 前記離散的コサイン変換処理により得られた離散的コサ
    イン変換係数から、文字と写真を判別することを特徴と
    する離散的コサイン変換による文書画像の領域分離方
    式。
JP5126553A 1993-05-28 1993-05-28 離散的コサイン変換による文書画像の領域分離方式 Pending JPH06339019A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5126553A JPH06339019A (ja) 1993-05-28 1993-05-28 離散的コサイン変換による文書画像の領域分離方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5126553A JPH06339019A (ja) 1993-05-28 1993-05-28 離散的コサイン変換による文書画像の領域分離方式

Publications (1)

Publication Number Publication Date
JPH06339019A true JPH06339019A (ja) 1994-12-06

Family

ID=14938023

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5126553A Pending JPH06339019A (ja) 1993-05-28 1993-05-28 離散的コサイン変換による文書画像の領域分離方式

Country Status (1)

Country Link
JP (1) JPH06339019A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0852041A1 (en) * 1995-09-14 1998-07-08 Bently Mills, Inc. Method and systems for manipulation of images of floor coverings or other fabrics
US6865290B2 (en) 2000-02-09 2005-03-08 Ricoh Company, Ltd. Method and apparatus for recognizing document image by use of color information
US7239748B2 (en) 2003-08-12 2007-07-03 International Business Machines Corporation System and method for segmenting an electronic image
WO2008139825A1 (ja) * 2007-05-08 2008-11-20 Olympus Corporation 画像処理装置および画像処理プログラム
WO2009104315A1 (ja) * 2008-02-21 2009-08-27 オリンパス株式会社 画像処理装置、画像処理方法および画像処理プログラム
US8218863B2 (en) 2008-01-30 2012-07-10 Ricoh Company, Ltd. Image processing apparatus, image processing method and image processing means

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0852041A1 (en) * 1995-09-14 1998-07-08 Bently Mills, Inc. Method and systems for manipulation of images of floor coverings or other fabrics
EP0852041A4 (en) * 1995-09-14 2001-01-10 Bently Mills Inc METHODS AND SYSTEMS FOR HANDLING IMAGES OF FLOOR COVERINGS OR OTHER TISSUES
US6865290B2 (en) 2000-02-09 2005-03-08 Ricoh Company, Ltd. Method and apparatus for recognizing document image by use of color information
US7239748B2 (en) 2003-08-12 2007-07-03 International Business Machines Corporation System and method for segmenting an electronic image
WO2008139825A1 (ja) * 2007-05-08 2008-11-20 Olympus Corporation 画像処理装置および画像処理プログラム
US8218863B2 (en) 2008-01-30 2012-07-10 Ricoh Company, Ltd. Image processing apparatus, image processing method and image processing means
WO2009104315A1 (ja) * 2008-02-21 2009-08-27 オリンパス株式会社 画像処理装置、画像処理方法および画像処理プログラム

Similar Documents

Publication Publication Date Title
US6633670B1 (en) Mask generation for multi-layer image decomposition
US6650773B1 (en) Method including lossless compression of luminance channel and lossy compression of chrominance channels
US8331671B2 (en) Image processing apparatus and image encoding method related to non-photo image regions
US7340092B2 (en) Image processing device, image processing method, program for executing image processing, and computer readable recording medium on which the program is stored
JP2003228712A (ja) イメージからテキスト状のピクセルを識別する方法
JP3972751B2 (ja) 画像処理装置
US8395813B2 (en) Subtractive color method, subtractive color processing apparatus, image forming apparatus, and computer-readable storage medium for computer program
US9384519B1 (en) Finding similar images based on extracting keys from images
US7672008B2 (en) Image processing device, method and program product for separating character, halftone graphic, and halftone photographic regions
WO2001063558A2 (en) System and method for image processing
JP2003179738A (ja) 画像処理装置
EP1103918A2 (en) Image enhancement on JPEG compressed image data
US8411940B2 (en) Method for fast up-scaling of color images and method for interpretation of digitally acquired documents
JPH06339019A (ja) 離散的コサイン変換による文書画像の領域分離方式
US20040257625A1 (en) Apparatus for, method of, and system for image processing
JP4441300B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体
JP3899872B2 (ja) 画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体
JP4116377B2 (ja) 画像処理方法および画像処理装置
JP2001222717A (ja) 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
JP2004242075A (ja) 画像処理装置および方法
Papamarkou et al. Conversion of color documents to grayscale
JP4228905B2 (ja) 画像処理装置及びプログラム
JP3030126B2 (ja) 画像処理方法
JP2005020413A (ja) 画像処理装置、画像処理方法およびその方法をコンピュータに実行させるためのプログラム
JP2005323066A (ja) 画像処理装置