JPH08307666A - 文書・写真混在多階調画像のデータ処理装置 - Google Patents

文書・写真混在多階調画像のデータ処理装置

Info

Publication number
JPH08307666A
JPH08307666A JP7105582A JP10558295A JPH08307666A JP H08307666 A JPH08307666 A JP H08307666A JP 7105582 A JP7105582 A JP 7105582A JP 10558295 A JP10558295 A JP 10558295A JP H08307666 A JPH08307666 A JP H08307666A
Authority
JP
Japan
Prior art keywords
image
area
character
density level
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7105582A
Other languages
English (en)
Inventor
Masahiko Shibuya
政彦 渋谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP7105582A priority Critical patent/JPH08307666A/ja
Publication of JPH08307666A publication Critical patent/JPH08307666A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

(57)【要約】 【目的】中間調の領域に黒文字や白抜き文字が存在する
ような画像形態であっても中間調の部分の再現できるよ
うに文字部分は文字画像の特徴に対応した最適な画像符
号化を施すことができるようにすること。 【構成】1画面に文書と絵柄像が混在した多階調の画像
信号を複数の領域に分割するデータ処理装置において、
画像信号を絵柄像領域と文字像領域に分離する分離手段
2と、この分離された文字像領域内の画像信号をほぼ同
一濃度レベルの領域毎に分ける分類手段3と、この分類
手段により分けられたほぼ同一濃度レベルの領域毎にそ
の画像信号についてその濃度レベルに応じて二値化する
と共に、この二値化したデータを二値化時の代表的な濃
度レベル情報とともに出力する変換手段4,5とより構
成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文書・写真混在多階調
画像信号を文字像領域、写真像領域等の像の特徴に応じ
て別々に分けて処理できるようにしたデ−タ処理装置に
関するものである。
【0002】
【従来の技術】画像情報は文字情報に比べると比較にな
らないほど膨大なデータ量を持つ。従って、画像情報を
伝送したり、記憶媒体に記憶するに際しては画像を符号
化して圧縮し、できるだけ容量を少なくする工夫がなさ
れている。
【0003】画像を符号化する方法は従来から種々のも
のが考案され、実用化されているが、それぞれ長所と短
所がある。例えば、ファクシミリなどで用いられている
MMR方式は、像の画質を劣化させることなく原画像信
号を符号化・復号化できるという長所があるが、この方
式は基本的にモノクローム(白黒)の二値画像用の符号
化方式であり、階調を持つ画像やカラー画像等のよう
に、多値のデータを必要とする画像(多値画像)には利
用できないという短所があって、主に文字画像の符号化
に向く符号化方式である。
【0004】一方、多値画像の符号化方式としては、カ
ラー静止画の圧縮標準であるJPEG(Joint Photograp
hic Coding Experts Grope) が知られている。このJP
EGは多階調(カラー画像を含む)の画像の符号化がで
きるが、画像データを所定画素単位のブロックに分割
し、各ブロックについて直交変換、例えば、離散コサイ
ン変換(Discrete Cosin Transform;以下、DCT変換
と呼ぶ)処理することによって画像の持つ空間周波数成
分を垂直・水平周波数成分に変換した後に量子化し、こ
の量子化したものをハフマン符号化することにより、デ
ータ圧縮するようにしているために、この方式で符号化
した圧縮画像を復号化すると、復元された画像はその画
質が原画像よりも劣化してしまうという問題がある。例
えば、文字画像などのエッジ部分がぼやける傾向がある
といった具合である。
【0005】このように、JPEGは復号化して得られ
る画像が元の画像よりも劣化してしまう。JPEGで画
質の劣化を防ぐ方法がないわけではなく、例えば、量子
化する際に量子化係数を変化させて符号化すれば改善さ
れる。しかし、量子化係数を変化させて符号化するとい
うことは、圧縮率を犠牲にするということを意味する。
従って、高圧縮率を要求される場合には向かないという
短所がある。
【0006】しかし、JPEGによる特徴的な画質劣化
は、像のエッジ部分がぼやける傾向があるというもので
あるから、劣化が目につきにくい写真画像の符号化には
このJPEGは適した符号化方式であるといえる。
【0007】このように、像の種別により、最適な符号
化方式が異なる。一方、符号化する対象の原画像につい
て考えてみると、それは例えば、文字ばかりの原稿の像
である場合もあれば、写真とその説明の文章が一枚の画
像の中に混在するといったように、性質の異なる像領域
が一枚の画像の中に混在する場合もある。また、写真画
像についても新聞や雑誌等のように網点画像として印刷
したものや無段階階調変化の画像である写真そのもの等
があり、あるいはこれら網点画像や写真そのものの画像
が同じ画像中に混在する場合がある。
【0008】このような網点画像や写真、文字が混在す
る場合、その画像を二値画像としてMMRなどで圧縮す
ると写真部分の階調性が失われることが多く、JPEG
で圧縮すると文字画像部分での画質の劣化が目立ってし
まうという問題点がある。
【0009】また、同じ写真部分の画像の符号化におい
ても、網点画像の場合にはDCT変換して得られる垂直
・水平周波数成分の高域成分のほとんどが網点のドット
に関する情報であるので、写真像領域と同一の方法で符
号化を行うと、高域成分の情報も符号化することとなる
ために、圧縮率が悪くなるといった問題があった。
【0010】近年においては、文字や網点画像、写真等
が混在する画像を扱いたい例は極めて多く、特にパソコ
ンやファクシミリ、データベースなどが広範囲にわた
り、ごく当たり前に利用される現代の環境下では上述し
た問題が残されたままになっていることは大きな障害で
ある。
【0011】従って、文字や網点画像、写真等が混在す
る画像を符号化するにあたっても、それぞれの像の画質
を損なうことなく、高圧縮率で画像の圧縮符号化がで
き、かつ、復元できるようにする技術の開発が嘱望され
ている。
【0012】これに応える技術として、写真像や網点像
と文字像とを含む混在画像のデータから文字像領域のデ
ータと写真像および網点像等の画像領域のデータを領域
判別手段により、分けて抽出し、これをそれぞれ専用の
符号化装置で符号化することにより、それぞれの画像の
特徴に合わせた最適な符号化方法を適用できて、それぞ
れの像の画質を損なうことなく、高圧縮率で画像の圧縮
符号化ができ、かつ、復元できるようにする試みがなさ
れている。
【0013】そこで重要となるのは、文字像領域のデー
タと、写真および網点像等の絵柄画像領域のデータを分
離する技術である。そして、この分離法は従来から多数
考案されている。
【0014】例えば、文字像領域と写真像領域と網点像
領域に分離分割する手法である像域分離処理の例として
は、明確な輪郭を必ず備えているという文字パターンの
特徴を活かしたエッジ領域検出処理と、網点の集合で画
像を表現する網点画像の検出を行う網点領域検出処理を
併用し、当該二つの処理の結果の総合判定により文字像
領域か絵柄像領域(網点像領域、写真像領域)かを判別
する手法が合理的である。
【0015】エッジ領域検出処理と網点領域検出処理結
果の総合判定により、例えば、エッジ領域検出ができて
網点領域検出ができなかった時は文字像領域の画像であ
ると判断し、網点領域検出ができた場合は、エッジ領域
検出が出来る出来ないにかかわりなく網点像領域の画像
であると判断し、エッジ領域検出ができなかった場合に
は網点領域検出が出来る出来ないにかかわりなく写真像
領域の画像であると判断する。これにより、像の種別対
応の分離抽出が容易に実施可能である。
【0016】ここで、エッジ領域検出は例えばつぎのよ
うにして行う。文字画像のデータは、濃度レベルが高レ
ベルと低レベルの画素(例えば、白地に黒で文字を書い
た場合には黒画素と白画素)が多く、かつ、エッジの部
分ではこれら濃度レベルが高レベルの画素と低レベルの
画素が連続している。一方、写真は多値情報であり、多
くの部分で中間値をとる。従って、濃度レベルが高レベ
ルの画素と低レベルの画素それぞれの連続性を調べれ
ば、エッジ領域であるか否かを検出することができる。
【0017】具体的手法としては入力画像のデータを三
値化し、この三値化した画像について、濃度レベルが高
レベルの画素と低レベルの画素それぞれの連続性を調
べ、エッジ/非エッジを判定する。
【0018】三値化は入力画像のデータにエッジ強調を
施した後、二種の固定閾値で比較して振り分けることに
よって高濃度画素、中間濃度画素、低濃度画素に分類
し、その分類した濃度対応のレベル値を与えることで実
現出来る。
【0019】濃度レベルが高レベルの画素と低レベルの
画素それぞれの連続性を調べるには、三値化後の濃度レ
ベルが高レベルの画素と低レベルの画素が連続するとこ
ろを、パターンマッチングにて検出する。画像は3×3
画素のブロック単位で扱うものとすれば、上記ブロック
単位でその各画素について三値化した後、その三値化済
みブロックの画素のパターンを、パターンマッチングで
検出する。
【0020】パターンマッチングは例えば、3×3画素
のブロックの画素について、高濃度レベルの画素の並び
が中心を通り、縦並びのもの、横並びのもの、斜めのも
の、低濃度レベルの画素の並びが中心を通り、縦並びの
もの、横並びのもの、斜めのもの等を基準のパターンと
して用意し、三値化済みブロックの画素の配置パターン
について、これらのパターンのいずれかに該当するもの
があるか否かを調べることで実現できる。なお、パター
ンは文字のエッジ部分が、ある方向性を持っていること
に着目して選ぶようにする。
【0021】つぎに、エッジ/非エッジを判定するに
は、所定のブロック内において、パターンマッチングで
検出した高濃度レベルの画素および低濃度レベルの画素
が、両者とも所定の個数以上、存在する場合、注目のブ
ロックをエッジ領域とし、それ以外は非エッジ領域と判
定する。
【0022】網点像領域の検出はつぎのようにして行
う。網点画像は絵を点で表現したものであるから、その
濃度分布はあたかも剣山の如く、円錐状の山(谷)が数
多くしかも、均一に存在している。この特性を利用して
網点とその他を分類する。すなわち、局所領域におい
て、網点の頂上と谷底にあたる画素(つまり、ピーク画
素)の密度が高く、それが均一に存在する部分を網点像
領域とする。
【0023】ピーク画素の検出の具体的な手法はつぎの
通りである。例えば、画像を3×3画素のブロックに分
け、このブロックにおいて中心画素の濃度レベルLが周
囲の全ての画素の濃度レベルより高い、あるいは低く、
かつ、Lと中心画素を挟んで対角線上に存在する対の画
素a,bの濃度レベルが、4対とも |2×L−a−b| > TH (但し、THは固定の閾値)なる条件を満たす場合、中
心画素をピーク画素とする。これでピーク画素が検出さ
れる。
【0024】つぎに網点像領域の検出はつぎのようにし
て行う。所定のブロック内においてピーク画素が存在す
れば、注目のブロックを網点候補領域とし、それ以外は
非網点候補領域と判定する。つぎに、この網点像領域の
結果を利用して補正を行う。これは、注目ブロックが非
網点候補領域と判定されたものであってもその周囲のブ
ロックの多くが網点候補領域であれば、網点像領域内の
ものである可能性が大きいからであり、この場合は前記
注目ブロックを網点像領域とする補正である。
【0025】逆に、注目ブロックが網点候補領域のもの
であると判定されたものであっても、その注目ブロック
の周囲のブロックの多くが非網点候補であると判定され
ていれば、網点像領域のブロックでない可能性が非常に
高いことになるため、この注目ブロックを非網点候補に
変更する補正をする。
【0026】つまり、入力画像について所定画素ブロッ
ク単位に分け、各ブロックについてピーク画素検出を行
い、これよりそのブロックが網点候補/非網点候補のい
ずれであるか判別を行い、この判別結果について隣接ブ
ロックの状態から網点候補/非網点候補の変更補正を施
してからそのブロックについて網点/非網点の判定を行
うことで網点像領域検出をすることが出来る。
【0027】このようにして網点領域検出とエッジ領域
検出を行ったならば、つぎに総合判定する。この総合判
定は、エッジ領域検出処理結果と網点領域検出処理結果
を用いての文字像領域/網点像領域/写真像領域の判定
である。すなわち、エッジ領域検出で、エッジ領域と判
定され、かつ、網点領域検出で非網点領域と判定された
領域は文字像領域とし、その他の領域を絵柄像領域(網
点像領域/写真像領域)とする。そして、絵柄像領域で
ある場合には、網点候補と判定されているとき、エッジ
/非エッジの判定にかかわりなく網点像領域の画像であ
ると判断し、エッジ/非エッジの判定結果がエッジであ
った場合には網点候補であるなしにかかわりなく写真像
領域の画像であると判断する。
【0028】
【発明が解決しようとする課題】文書・写真画像が混在
する画像信号を圧縮符号化処理するためには、画像信号
それぞれの特性にあわせて処理(符号化・復号化・フィ
ルタ処理等)を行った方が一枚の画像として画像を取り
扱うよりもその部分に対して最適な処理を施せる。そこ
で、このような文書・写真画像が混在する画像信号を圧
縮符号化処理するにあたり、文書や写真画像等のように
性質の異なる像領域の画像信号を像領域別に分離するこ
とが行われる。
【0029】このような文書・写真混在画像を分離する
ための方法としては従来から多数考案されており、例え
ばエッジ領域検出による文字領域検出方法や、ピーク画
素検出による網点領域検出法を併用して、その検出結果
から総合的に判断することで、文書・写真混在画像を種
別対応に分離抽出する技術があげられる。
【0030】そして、この技術はエッジ領域検出では、
文字画像の特性(文字画像ではその濃度レベルが高レベ
ル(白)と低レベル(黒)にはっきりと分かれ、かつエ
ッジ部分では黒画素と白画素が連続している)と、写真
画像の特性(写真画像では濃度レベルが中間レベルをと
ることが多い)に着目して、これらの特性を利用するこ
とにより、文字像領域と写真像領域の検出を行ってい
る。
【0031】ところで、原稿をイメージスキャナで読み
取って画像デ−タ化する場合を考えてみると、それは例
えば、写真とその説明文が一枚の画像の中に混在すると
いったように、性質の異なる像領域が一枚の画像の中に
混在する場合や、文字が濃度レベルが中間調で表現され
ている場合、濃度レベルが中間調の領域中に黒文字や白
文字が存在する場合など様々である。そして、文字像領
域の画像に中間調の領域が存在する場合に問題が大き
い。
【0032】すなわち、分割後の文字像領域のデータは
後処理の関係上、二値データ化して取り扱うようにする
ことが多く、従って、後処理時に二値化してしまうこと
により、中間調データが失われてしまうという問題であ
る。
【0033】従って、中間調の領域に黒文字や白抜き文
字が存在するような画像形態であっても文字部分は文字
画像の特徴に対応した最適な画像符号化を施すことがで
き、また、中間調の部分は、中間調が再現できるような
最適な画像符号化を施すことができるようにする手法の
確立が望まれている。
【0034】そこでこの発明の目的とするところは、一
枚の画面中に文字像領域部分や写真像領域部分が混在す
る画像であって、しかも、文字が中間調の背景の中に埋
もれるような画像像領域を含む画像であっても、文字は
文字、中間調は中間調の特徴を失うことのない最適なデ
ータに処理して出力することができるようにした文書・
写真混在画像のデータ処理装置を提供することにある。
【0035】
【課題を解決するための手段】上記目的を達成するた
め、本発明はつぎのように構成する。すなわち、第1に
は、1画面に文書と絵柄像が混在した多階調の画像信号
を複数の領域に分割するデータ処理装置において、画像
信号を絵柄像領域と文字像領域に分離する画像領域分離
手段と、この分離された文字像領域内の画像信号をほぼ
同一濃度レベルの領域毎に分ける分類手段と、この分類
手段により分けられたほぼ同一濃度レベルの領域毎にそ
の画像信号についてその濃度レベルに応じて二値化する
と共に、この二値化したデータを二値化時の代表的な濃
度レベル情報とともに出力する変換手段とより構成す
る。
【0036】第2には、1画面に文書と絵柄像が混在し
た多階調の画像信号を複数の領域に分割して符号化・復
号化処理するデータ処理装置において、画像信号を絵柄
像領域と文字像領域に分離する画像領域分離手段と、絵
柄像領域の画像信号を符号化する絵柄画像符号化手段
と、前記画像領域分離手段により分離された文字像領域
内の画像信号をほぼ同一濃度レベルの領域毎に分ける分
類手段と、この分類手段により分けられたほぼ同一濃度
レベルの領域毎にその画像信号についてその濃度レベル
に応じて二値化すると共に、この二値化したデータを二
値化時の代表的な濃度レベル情報とともに出力する変換
手段と、この変換手段からの出力を符号化する文字像用
符号化手段と、よりなる符号化処理系と、前記文字像用
符号化手段により符号化された文字像領域内の画像信号
を復号化すると共に、二値化時の代表的な濃度レベル情
報を用いて元の濃度レベルの画像信号に復元する復元処
理手段と、前記絵柄画像符号化手段により符号化された
画像信号を復号化する復号化手段と、この復号化手段に
より復号化された画像信号と前記復元処理手段により復
元された画像信号を合成して元の1画面の画像信号にし
て出力する合成手段と、よりなる復号化処理系と、を具
備する構成とする。
【0037】
【作用】上記の第1の構成においては、画像領域分離手
段により、入力画像信号を絵柄像領域と文字像領域に分
離すると共に、この分離された文字像領域内の画像信号
を分類手段によりほぼ同一濃度レベルの領域毎に分け、
変換手段では、この分けられたほぼ同一濃度レベルの領
域毎にその画像信号についてその濃度レベルに応じて二
値化すると共に、この二値化したデータを二値化時の代
表的な濃度レベル情報とともに出力するようにした。
【0038】従って、画像信号内に文字や写真等のよう
な性質の異なる複数の領域が混在する場合に、画像の圧
縮のための符号化処理を行う前に文字像領域部分や写真
等のような絵柄像領域部分などの像の特性に合わせて画
像を領域分割することで、分割した領域毎に最適な符号
化処理を施すことができるようになる。また、分類手段
と変換手段を設けて文字像領域を背景の濃度レベル対応
に領域分けし、その濃度レベルに応じて二値化すると共
に、この二値化したデータを二値化時の代表的な濃度レ
ベル情報とともに出力するようにしたので、文字像領域
についてその背景色の状態が異なるものであっても、そ
れが再現できるようにして二値化でき、従って、中間調
で表現された文字像領域の画像のデータを中間調を失う
ことなく二値化することが可能となる。
【0039】上記の第2の構成においては、画像領域分
離手段により、入力画像信号を絵柄像領域と文字像領域
に分離すると共に、この分離された文字像領域内の画像
信号を分類手段によりほぼ同一濃度レベルの領域毎に分
け、変換手段では、この分けられたほぼ同一濃度レベル
の領域毎にその画像信号についてその濃度レベルに応じ
て二値化すると共に、この二値化したデータを二値化時
の代表的な濃度レベル情報とともに出力する。そして、
この変換手段からの出力を文字像用符号化手段により符
号化する。また、画像領域分離手段により分離された絵
柄像領域の画像信号は絵柄画像符号化手段により符号化
される。
【0040】このようにして符号化処理された画像信号
を復号化するにあたっては、まず、前記文字像用符号化
手段により符号化された文字像領域内の画像信号は復元
処理手段により復号化すると共に、二値化時の代表的な
濃度レベル情報を用いて元の濃度レベルの画像信号に復
元し、絵柄画像符号化手段により符号化された画像信号
は復号化手段により復号化する。そして、この復号化手
段により復号化された画像信号と前記復元処理手段によ
り復元された画像信号は合成手段に与えられ、ここで合
成して元の1画面の画像信号にして出力する。
【0041】このように、第2の構成においては、入力
画像信号を絵柄像領域と文字像領域に分離すると共に、
この分離された文字像領域内の画像信号を分類装置によ
りほぼ同一濃度レベルの領域毎に分け、変換装置では、
この分けられたほぼ同一濃度レベルの領域毎にその画像
信号についてその濃度レベルに応じて二値化すると共
に、この二値化したデータを二値化時の代表的な濃度レ
ベル情報とともに出力するようにした。
【0042】従って、画像信号内に文字や写真等のよう
な性質の異なる複数の領域が混在する場合に、画像の圧
縮のための符号化処理を行う前に文字像領域部分や絵柄
像(写真等)領域部分などの像の特性に合わせて画像を
領域分割することで、分割した領域毎に最適な符号化処
理を施すことができるようになる。また、分類装置と変
換装置を設けて文字像領域を背景の濃度レベル対応に領
域分けし、その濃度レベルに応じて二値化すると共に、
この二値化したデータを二値化時の代表的な濃度レベル
情報とともに出力するようにしたので、文字像領域につ
いてその背景色の状態が異なるものであっても、それが
再現できるようにして二値化でき、従って、中間調で表
現された文字像領域の画像のデータを中間調を失うこと
なく二値化することが可能となる。
【0043】
【実施例】以下、本発明の実施例について、図面を参照
して説明する。本発明は、文字や、写真像などの混在画
像の画像信号を、文字、写真などの種別対応に領域分割
して振り分け、それぞれの像の特徴を失うことのないよ
うに、しかも、符号化処理の段階で十分な符号化効率
(圧縮効率)を確保できるようなデータ形式にデータ化
して出力する装置であり、中間調の背景に文字があるよ
うなケースであっても、文字は文字、中間調領域は中間
調の特徴を失わないようにデータ化することができるよ
うにしたもので、以下、詳細を説明する。
【0044】(実施例1)図1は、本発明による文書・
写真混在多階調画像の像域分離装置の構成を示すブロッ
ク図であり、図中1はイメージスキャナ、2は領域分離
装置、3は濃度レベル別領域分類処理装置、4は文字領
域信号変換装置、5は二値画像データ出力装置、6は写
真画像の出力装置である。
【0045】これらのうち、イメージスキャナ1は、原
稿の像を読み取って画像信号を生成するものであり、モ
ノクローム(単一色)用のイメージスキャナである。画
像信号は256階調とし、階調レベル“0”が最も暗い
ことを、階調レベル“255”が最も明るいことを示す
ものとする。本実施例では説明の簡単化のために、画像
信号は写真画像と文字画像が混在したモノクローム多階
調で表現されている信号であるものとする。
【0046】領域分離装置2はイメージスキャナ1の出
力する画像信号を受けて、この画像信号を文字画像と写
真画像に領域分離して出力する装置であって、上記画像
信号を2種類の領域に分割し、その結果を領域分割信号
として出力するものである。ここでは、画像信号を文字
像領域と写真像領域に分割する。
【0047】なお、領域分離装置2は入力画がカラーの
場合にも拡張することが可能である。例えば、イメージ
スキャナ1をカラーイメージスキャナとすれば、得られ
る画像信号かカラー画像信号とすることができ、このよ
うに入力画像信号がカラー画像信号の場合には、入力画
像信号の隣合う画素間の色空間上の距離を求め、この色
空間上の距離の大きさの関係から、文字像領域と写真像
領域に分離することができる。
【0048】具体的には、カラー画像中の文字像領域と
写真像領域の分離を実施するには、隣合う画素の色空間
上の距離から文字のエッジを検出する方法を用いる。モ
ノクローム多階調画像中の文字像と写真像の領域分離を
実施する場合では、隣合う画素の濃度レベルの差から文
字のエッジを検出する方法を利用した方式を使用する。
【0049】濃度レベル別領域分類処理装置3は文字像
領域中の同じ濃度レベルの領域を分類するための装置で
あり、文字像領域を一定間隔でサンプリングすることに
よって濃度レベル毎の領域分類を行う。
【0050】文字領域信号変換装置4は文字像領域の画
像信号の二値化データ変換装置であり、画像信号のうち
の文字像領域に属する部分の画像信号を二値のデータ
(二値画像データ)に変換する装置である。画像信号の
二値化には色々な方法があるが、ここでは一定のしきい
値を用意し、画像信号の値がこのしきい値より小さな値
ならば“0”とし、大きな値ならば“1”とする単純二
値化の手法を用いるものとする。文字像領域のための二
値化であるから、誤差拡散などの方法は適切ではない。
また、“0”は二値化を行う文字像領域中の濃度レベル
を基準とするものとする。
【0051】二値画像データ出力装置5は二値画像デー
タを文字の画像データとわかるような形態のデータとし
て出力する装置であり、文字領域信号変換装置4によっ
て二値画像データに変換された文字像領域の信号(デー
タ信号)の最初の2バイトに、基準となる濃度レベル値
(“0”を示す値)と文字を示す濃度レベル値(“1”
を示す値)を付加して二値画像データを出力するための
装置である。
【0052】写真画像出力装置6は領域分離装置2によ
り分離されて与えられる写真画像の領域の信号を濃度レ
ベル対応の多値のデータとして出力する装置であり、一
旦、バッファリングして写真画像の領域の画像信号とし
て後段に与えるものである。
【0053】つぎに上記構成の本装置の作用を説明す
る。ここでは、文書をイメージスキャナ1で読み取って
その画像データを符号化(圧縮符号化)し、記憶装置に
記憶しておき、それを取り出して伸長して元の画像に復
元し、表示するような一種の画像データベース装置に本
発明を適用する例を説明する。
【0054】ここでは画像処理を行う前に画像の分離を
行う例を示す。まず、原稿がイメージスキャナ1で読み
取られて、256階調のモノクローム画像信号が生成さ
れる。ここでは例として、図2(a)のような文字(文
章)と写真画像のある原稿30をイメージスキャナ1で
読み取った場合について述べる。
【0055】図2において、符号A1を付した部分が写
真部分であり、符号A2,A3,A4を付した部分がN
o.1,No.2,No.3の各文字像領域部分を示す。ここではN
o.1,No.2,No.3の各文字像領域A2〜A4部分は、濃
度がそれぞれ異なるものとする。
【0056】イメージスキャナ1で読み取られた原稿は
256階調のモノクロ画像信号に変換されて領域分離装
置2に入力される。すると、領域分離装置2ではこの画
像信号について文字像領域と写真像領域に分割して、図
2(b),(c)のような領域分割した画像の信号が生
成される。このときの文字像領域の判別にはエッジ領域
検出処理の手法を用いる。そして、残りの領域を写真画
像として判別を行う。
【0057】すなわち、エッジ領域検出は例えばつぎの
ようにして行う。文字画像のデータは、濃度レベルが高
レベルと低レベルの画素(例えば、白地に黒で文字を書
いた場合には黒画素と白画素)が多く、かつ、エッジの
部分ではこれら濃度レベルが高レベルの画素と低レベル
の画素が連続している。一方、写真は多値情報であり、
多くの部分で中間値をとる。従って、濃度レベルが高レ
ベルの画素と低レベルの画素それぞれの連続性を調べる
ことで、エッジ領域であるか否かを検出する。
【0058】領域分離装置2はこのようにしてエッジ領
域とした画像信号については濃度レベル別領域分離装置
3に出力し、そして、エッジ領域とされなかった残りの
領域の信号は写真画像の画像信号として写真画像出力装
置6に送る。
【0059】このようにして、領域分離装置2により領
域毎に分割されて出力された画像信号のうち、写真像領
域の画像信号は写真画像出力装置6より多値信号として
出力され、一方、文字像領域の画像信号は濃度レベル別
領域分離装置3において、一定間隔でサンプリングさ
れ、同じ濃度レベルの領域を分離する処理がなされる。
【0060】すなわち、濃度レベル別領域分離装置3で
は1画面分の文字像領域の信号について全体を一定間隔
でサンプリングすることにより、文字画像中のほぼ同じ
濃度レベルの画素が占める領域を分離する。
【0061】図2(d),(e),(f)に濃度レベル
毎に分離された文字像領域の例を示す。ここで符号A
2,A3,A4はそれそれ異なる濃度レベルの文字像領
域である。
【0062】濃度レベル別領域分離装置3により濃度レ
ベル別に分類された文字像領域の画像信号は、文字領域
信号変換装置4において二値化される。ここでは、二値
化を行う際に、分類された濃度レベル(背景色)を基準
値“0”、文字の濃度レベルを“1”として二値化を行
う。そして、この二値化したものを二値画像データ出力
装置5に出力し、当該二値画像データ出力装置5ではこ
の二値化して与えられたデータの最初の2バイトに、背
景の濃度レベル値の代表値と文字の濃度レベル値の代表
値を付加して出力する。
【0063】当該二値画像データ出力装置5の出力デー
タ構成例を図3に示す。ここで、符号D1,D2を付し
た部分はNo.1の文字像領域A2の背景濃度レベルの代表
値と文字濃度レベルの代表値のデータ格納部を示してお
り、符号D3,D4を付した部分はNo.2の文字像領域A
3の背景濃度レベルの代表値と文字濃度レベルの代表値
のデータ格納部を示しており、符号D5,D6を付した
部分はNo.3の文字像領域A4の背景濃度レベルの代表値
と文字濃度レベルの代表値のデータ格納部を示してい
る。
【0064】この結果、二値画像データ出力装置5から
は文字像領域の画像について、その背景相当の領域の濃
度レベルのほぼ等しいもの単位で領域が分割され、その
分割されたものについてそれぞれ背景濃度レベルの代表
値と文字濃度レベルの代表値を先頭に、これら背景と文
字を二値化した画像データに変換して出力し、写真像領
域については画素毎の濃度レベル対応の値にした多値の
画像データとして出力することになる。
【0065】そのため、後段では写真像領域については
多値の画像データをJPEGなどのような直交変換(D
CT変換)処理,ハフマン符号化処理を施して圧縮符号
化する写真画像に適用して最適な符号化処理手法で圧縮
処理することができ、文字像領域については輪郭画像に
ついて輪郭のボケを生じることなく高い効率で圧縮符号
化できるランレングス符号化による圧縮符号化を施すこ
とができるようになる。
【0066】しかも、文字像領域の画像については、背
景の濃度レベル別に分割してこれを二値化しており、背
景濃度レベル値と文字濃度レベル値をその領域のデータ
の先頭に付加して送るので、再生時には復号化したデー
タについてこの背景濃度レベル値と文字濃度レベル値を
使用して二値データを多値データに復元した後、各領域
の復元データと写真像領域の復号化データとを合成して
元の一枚の画像に復元することで、中間値濃度の背景等
を含む文字画像は文字画像としてその背景濃度を損なう
ことなく輪郭のはっきりした像として再現できるように
なり、文字像領域が中間値濃度の背景を含む場合でも、
再現性のよい画像を得ることのできる画像領域別のデー
タ化処理を行うことができるようになる。
【0067】以上のように1画面に文字像と写真像等の
絵柄像とが混在した文書・写真混在多階調画像信号を複
数の領域に分割する装置であって、入力画像信号を(画
像のエッジ検出とそのエッジの連続性に基づいて)絵柄
像領域と文字像領域に分離する画像領域分離装置と、こ
の分離された文字像領域内の画像信号をほぼ同一濃度レ
ベルの領域毎に分ける分類装置と、この分類装置により
分けられたほぼ同一濃度レベルの領域毎にその画像信号
についてその濃度レベルに応じて二値化すると共に、こ
の二値化したデータを二値化時の代表的な濃度レベル情
報とともに出力する変換装置とより構成し、画像領域分
離装置により、入力画像信号を絵柄像領域と文字像領域
に分離すると共に、この分離された文字像領域内の画像
信号を分類装置によりほぼ同一濃度レベルの領域毎に分
け、変換装置では、この分けられたほぼ同一濃度レベル
の領域毎にその画像信号についてその濃度レベルに応じ
て二値化すると共に、この二値化したデータを二値化時
の代表的な濃度レベル情報を含めて出力するようにし
た。
【0068】画像信号内に文字や写真等のような性質の
異なる複数の領域が混在する場合に、画像の圧縮のため
の符号化処理を行う前に文字像領域部分や絵柄像(写真
等)領域部分などの像の特性に合わせて画像を領域分割
することで、後段では写真像領域については多値の画像
データをJPEGなどのような直交変換(DCT変換)
処理,ハフマン符号化処理を施して圧縮符号化する写真
画像に適用して最適な符号化処理手法で圧縮処理するこ
とができ、文字像領域については輪郭画像について輪郭
のボケを生じることなく高い効率で圧縮符号化できるラ
ンレングス符号化による圧縮符号化を施すことができる
ようになるなど、分割した領域毎に最適な符号化処理を
施すことができるようになる。
【0069】また、分類装置と変換装置を設けて文字像
領域を背景の濃度レベル対応に領域分けし、その濃度レ
ベルに応じて二値化すると共に、この二値化したデータ
を二値化時の代表的な濃度レベル情報とともに出力する
ようにしたので、これを圧縮符号化し、復号化した際
に、文字像領域についてその背景色の状態が異なるもの
であっても、それが再現できるようにして二値化できて
おり、従って、中間調で表現された文字像領域の画像の
データを中間調を失うことなく二値化することが可能と
なる。
【0070】つぎに実施例1の像域分離・データ化処理
技術を画像データベース装置などに適用した場合のシス
テム構成を実施例2として説明する。 (実施例2)図4は写真付文書を多数蓄積して検索を可
能にする画像データベース装置などを構成するに最適な
システム構成例を示すブロック図である。
【0071】図中、1はイメージスキャナ、2は領域分
離装置、3は濃度レベル別領域分類処理装置、4は文字
領域信号変換装置、5は二値画像データ出力装置、6は
写真画像の出力装置であり、これらは実施例1で説明し
たものと機能および構成は変わらない。11は文字画像
用符号化装置、12は写真画像用符号化装置、19は網
点画像用符号化装置、13は記憶装置、14は多階調画
像復号化装置、15は文字領域復号化装置、16は画像
変換装置、17は画像合成装置、18は表示装置であ
る。
【0072】これらのうち、文字画像用符号化装置11
は、二値化画像信号変換装置5によって二値画像に変換
された文字像領域画像のデータの符号化装置であり、符
号化画像信号を生成する。ここでは、ランレングス符号
化方式を用いて符号化する。写真画像用符号化装置12
は、写真画像の符号化装置であり、領域分離装置2が写
真像領域の画像デ−タと判定して分離出力したものを符
号化して符号化画像信号を生成するものである。ここで
は例えば、JPEG方式を用いて写真像領域の画像デー
タを符号化するようにしている。
【0073】記憶装置13は、上記文字画像用符号化装
置11、写真画像用符号化装置12が符号化して出力す
る各符号化画像信号を多数記憶しておくための装置であ
り、各符号化画像信号を1枚の画像中におけるそれぞれ
の位置や種別等がわかるように記憶される。
【0074】多階調画像復号化装置14は、記憶装置1
3から読み出された符号化画像信号を復号化して画像デ
ータ化する復号化装置であり、記憶装置13から読み出
された符号化画像信号のうち、種別がJPEG方式で符
号化されたものについて復号化するものであって、JP
EG方式で符号化された写真画像信号を復号化して、写
真画像信号を生成するものである。
【0075】文字領域復号化装置15は、記憶装置13
から読み出された文字像領域の符号化画像信号を復号化
して画像信号化する復号化装置であり、ランレングス符
号化方式で符号化された画像信号を復号化して画像信号
を生成するものである。ランレングス符号化方式である
から、符号化する前の原画像の画像信号と復号化して得
た画像信号とは完全に一致し、符号化・復号化処理に伴
う画質劣化がない。また、文字領域復号化装置15は、
復号化した文字像領域のデータフォ−マットが、先頭に
背景の濃度レベル値を、そしてつぎに文字の濃度レベル
値を格納し、そのあとに背景の画素のデータを“0”、
文字を“1”として二値化したデータが続く形式として
ある。
【0076】そこで、画像変換装置16は、二値化デー
タをこの濃度レベル値を利用して元の濃度レベル値に戻
す処理を実施し、元に戻した濃度レベル値による画像デ
ータにして画像合成装置17に出力する構成としてあ
る。
【0077】画像合成装置17は各領域の復号化画像デ
ータを合成して1枚のもとの画像を生成するための装置
であり、多階調画像復号化装置14と画像変換装置16
からの復号化画像を合成して1枚の画像にする装置であ
る。表示装置18は復号化画像信号を表示するための装
置であり、画像合成装置17で合成された画像を表示す
るための装置である。
【0078】つぎにこのような構成の装置の作用を説明
する。まず、原稿がイメージスキャナ1で読み取られ
て、256階調のモノクロ画像信号が生成される。原稿
は写真像領域部分と文字像領域部分とからなり、文字像
領域は部分によって中間調の背景色があるものとする。
【0079】イメージスキャナ1で読み取られた原稿は
256階調のモノクロ画像信号に変換されて領域分離装
置2に入力される。すると、領域分離装置2ではこの画
像信号について文字像領域と写真像領域に分割して、文
字像領域のものは濃度レベル領域分離処理装置3に、そ
して、写真像領域のものは写真画像出力装置6に入力す
る。このときの文字像領域の判別にはエッジ領域検出処
理の手法を用いる。そして、残りの領域を写真画像とし
て判別を行う。
【0080】このようにして、領域分離装置2により領
域ごとに分割された画像信号のうち、写真像領域の画像
信号は写真画像出力装置6に一旦蓄えられ、その後、多
値信号として写真画像用符号化装置に出力され、一方、
文字像領域の画像信号は濃度レベル別領域分離装置3に
おいて、一定間隔でサンプリングされ、同じ濃度レベル
の領域を分離する処理がなされる。
【0081】すなわち、濃度レベル別領域分離装置3で
は1画面分の文字像領域の信号について全体を一定間隔
でサンプリングすることにより、文字画像中の同じ濃度
レベルの画素が占める領域を分離する。これにより、図
2(c)に示す如き文字像領域の画像は、図2(d),
(e),(f)に示す濃度レベルごとに分離された画像
信号になる。
【0082】濃度レベル別領域分離装置3により濃度レ
ベル別に分類された文字像領域の画像信号は、文字領域
信号変換装置4において二値化される。ここでは分類さ
れた濃度レベル(背景色)を例えば、基準値“0”、文
字の濃度レベルを“1”として二値化を行う。そして、
元の濃度レベルの値と共に、この二値化したものを二値
画像データ出力装置5に出力する。すると当該二値画像
データ出力装置5ではこの二値化して与えられたデータ
の最初の2バイトに、背景の濃度レベル値と文字の濃度
レベル値を付加した図3に示す如きフォーマットでデー
タを文字画像用符号化装置11に出力する。そして、文
字画像用符号化装置11ではこのデータをランレングス
符号化処理する。
【0083】一方、領域分離装置2によって分離された
写真像領域の画像信号は、写真画像出力装置6に送ら
れ、ここで一旦バッファリングされた後、写真画像用符
号化装置12に送られ、ここでJPEG方式により符号
化される。
【0084】この結果、文字像領域の画像について、そ
の背景相当の領域の濃度レベルのほぼ等しいもの単位で
領域が分割され、その分割されたものについてそれぞれ
背景濃度レベルと文字濃度レベルの値を先頭に配置し、
これら背景と文字を二値化した画像データに変換した形
式のデータとなる。そして、二値化は輪郭画像に適した
符号化形式で符号化方式であり、文字像に最適な方式で
あり、写真像領域については画素毎の濃度レベル対応の
値にした多値の画像データとして出力されたものがJP
EGにより符号化されることによって写真等に適した符
号化形式で符号化されることになる。
【0085】このようにして、文字画像用符号化装置1
1、多値画像用符号化装置12それぞれで圧縮符号化さ
れたデータは、記憶装置13に格納される。以上で圧縮
処理、圧縮画像の保存のステップは終了する。
【0086】つぎに再生、すなわち、復号化と表示につ
いて説明する。画像信号の復号化を行うためには、記憶
装置13に保存されている符号化データをそれぞれ読み
出してつぎの如き復号化処理を行う。絵柄像領域の符号
化データつまり、写真画像の領域の符号化データはJP
EGにより符号化されているデータであるから、JPE
G復号化器である多階調画像復号化装置14によりJP
EG復号化を行い、文字像領域の符号化データはランレ
ングス符号化されたデータであるから、ランレングス復
号化器である文字領域復号化装置15でランレングス復
号化処理を行う。
【0087】文字領域復号化装置15では復号したデー
タについて、さらに濃度レベル値部分の情報を参照して
元の階調の濃度データに戻す。すなわち、文字像領域の
データは背景の濃度レベル値と、文字部分の濃度レベル
値とを保持しており、背景のデータを“0”値に、そし
て、文字部分のデータを“1”値にするかたちで、二値
データ化してあるので、“0”値のデータを背景の濃度
レベル値に戻し、“1”値のデータを文字部分の濃度レ
ベル値に戻すことができる。
【0088】このようにして、復号化された画像を画像
データ合成装置17で1枚の画像に合成した後に、表示
装置18で画像データを表示する。以上のように文字や
写真等のような性質の異なる複数の像領域が一枚の画像
に混在する画像を圧縮する場合、像を文字像領域と写真
像領域に分離し、分離した像それぞれについて画像の特
性に合わせて符号化することで、単純に一種類の圧縮方
法を用いた場合に比べ、圧縮率を大幅に改善することが
できるようになるばかりでなく、中間調の背景中に文字
があるような場合でも、このような文字像領域の画像に
ついては、背景の濃度レベル別に領域を分割してこの分
割した領域のデータについて二値化しており、しかも、
背景濃度レベル値と文字濃度レベル値をその領域のデー
タの先頭に付加して送るようにしているので、再生時に
は復号化したデータについてこの背景濃度レベル値と文
字濃度レベル値を使用して二値データを多値データに復
元した後、各領域の復元データと写真像領域の復号化デ
ータとを合成して元の一枚の画像に復元することで、中
間値濃度の背景等を含む文字画像は文字画像としてその
背景濃度を損なうことなく輪郭のはっきりした像として
再現できるようになり、従って、文字像領域が中間値濃
度の背景を含む場合でも、再現性のよい画像を得ること
のできる画像符号化・復号化処理を行うことができるシ
ステムが提供できるようになる。
【0089】以上は、文字像領域と写真等の絵柄像領域
が1画面内に混在する画像について文字像領域と絵柄像
領域に分け、文字像領域の像については中間調が再現で
きるように背景濃度レベル別に領域を切り分け、各切り
分けた領域のデータには先頭に背景の濃度レベル値と文
字の濃度レベル値を保持させ、背景の濃度レベル値と文
字の濃度レベル値対応に“0”,“1”に置き換えて二
値化するようにして文字像領域の中間調の背景の再現性
を確保するようにしつつ、十分な圧縮率を確保するよう
にしたものであるが、絵柄像領域は写真そのものであっ
てもまた、網点画像であってもすべて一様に多値データ
化してこれを符号化し、復号化する構成であった。
【0090】しかし、写真そのものと、網点画像では符
号化にあたり、区別して処理すると網点画像はさらに圧
縮率を高めることができる。そこで、つぎに写真そのも
のと、網点画像では符号化にあたり、区別して処理する
構成し、文字像領域については中間調の背景がある場合
に、その中間調の背景の再現性を確保するようにしつ
つ、十分な圧縮率を確保するようにした圧縮符号化効率
の一段と良い、しかも、再生画像の品位の高い写真・文
書混在画像の画像処理装置をつぎに説明する。
【0091】(実施例3)実施例3の構成は図5に示す
如きであり、基本的には図4で説明した実施例2の構成
と同じである。実施例3では実施例2の構成に、さらに
網点画像の処理系を付加した。すなわち、実施例2にお
ける領域分離装置2は入力された画像信号を文字像領域
と写真像領域とに分離して出力するものであったが、こ
の実施例3では画像信号を文字像領域と写真像領域と網
点像領域に分離してそれぞれ別に出力する機能を備えた
領域分離装置2Aとしている。
【0092】文字像領域と写真像領域と網点像領域に分
離分割する具体的手法としては、従来より種々の方式が
考案されており、実用化されているのでこれら既存技術
を使用して行う。本発明ではエッジ領域検出処理と、ピ
ーク情報を利用した網点領域検出処理を利用し、両者の
検出結果を総合的に判断して領域を区別する方式を採用
する。ピーク情報を利用した網点領域検出処理は網点画
像に含まれる特有のピーク情報を利用したものであり、
ここでは自動領域判別のための画像信号としてものクロ
ーム画像であればその階調値(濃度レベル値)を、ま
た、RGBのカラー画像信号であればそのうちのG信号
を輝度情報の代わりに用いることとする。
【0093】文字像領域と写真像領域と網点像領域に分
離分割する像域分離処理は、エッジ領域検出処理と網点
領域検出処理の二つからなり、そして、当該二つの処理
の総合判定により文字像領域か絵柄像領域(網点像領
域、写真像領域)かを判別する。例えば、エッジ領域検
出ができて網点領域検出ができなかった時は文字像領域
の画像であると判断し、網点領域検出ができた場合は、
エッジ領域検出が出来る出来ないにかかわりなく網点像
領域の画像であると判断し、エッジ領域検出ができなか
った場合には網点領域検出が出来る出来ないにかかわり
なく写真像領域の画像であると判断する。
【0094】エッジ領域検出は例えばつぎのようにして
行う。文字画像のデータは、濃度レベルが高レベルと低
レベルの画素(例えば、白地に黒で文字を書いた場合に
は黒画素と白画素)が多く、かつ、エッジの部分ではこ
れら濃度レベルが高レベルの画素と低レベルの画素が連
続している。一方、写真は多値情報であり、多くの部分
で中間値をとる。従って、濃度レベルが高レベルの画素
と低レベルの画素それぞれの連続性を調べれば、エッジ
領域であるか否かを検出することができる。
【0095】具体的手法としては入力画像のデータを三
値化し、この三値化した画像について、濃度レベルが高
レベルの画素と低レベルの画素それぞれの連続性を調
べ、エッジ/非エッジを判定する。
【0096】濃度レベルが高レベルの画素と低レベルの
画素それぞれの連続性を調べるには、三値化後の濃度レ
ベルが高レベルの画素と低レベルの画素が連続するとこ
ろを、パターンマッチングにて検出する。画像は3×3
画素のブロック単位で扱うものとすれば、上記ブロック
単位でその各画素について三値化した後、その三値化済
みブロックの画素のパターンを、パターンマッチングで
検出する。
【0097】パターンマッチングは例えば、3×3画素
のブロックの画素について、高濃度レベルの画素の並び
が中心を通り、縦並びのもの、横並びのもの、斜めのも
の、低濃度レベルの画素の並びが中心を通り、縦並びの
もの、横並びのもの、斜めのもの等を基準のパターンと
して用意し、三値化済みブロックの画素の配置パターン
について、これらのパターンのいずれかに該当するもの
があるか否かを調べることで実現できる。なお、パター
ンは文字のエッジ部分が、ある方向性を持っていること
に着目して選ぶようにする。
【0098】つぎに、エッジ/非エッジを判定するに
は、所定のブロック内において、パターンマッチングで
検出した高濃度レベルの画素および低濃度レベルの画素
が、両者とも所定の個数以上、存在する場合、注目のブ
ロックをエッジ領域とし、それ以外は非エッジ領域と判
定する。
【0099】網点像領域の検出はつぎのようにして行
う。網点画像は絵を点で表現したものであるから、その
濃度分布はあたかも剣山の如く、円錐状の山(谷)が数
多くしかも、均一に存在している。この特性を利用して
網点とその他を分類する。すなわち、局所領域におい
て、網点の頂上と谷底にあたる画素(つまり、ピーク画
素)の密度が高く、それが均一に存在する部分を網点像
領域とする。
【0100】ピーク画素の検出の具体的な手法はつぎの
通りである。例えば、画像を3×3画素のブロックに分
け、このブロックにおいて中心画素の濃度レベルLが周
囲の全ての画素の濃度レベルより高い、あるいは低く、
かつ、Lと中心画素を挟んで対角線上に存在する対の画
素a,bの濃度レベルが、4対とも |2×L−a−b| > TH (但し、THは固定の閾値)なる条件を満たす場合、中
心画素をピーク画素とする。これでピーク画素の検出が
できる。
【0101】つぎに網点像領域の検出はつぎのようにし
て行う。所定のブロック内においてピーク画素が存在す
れば、注目のブロックを網点候補領域とし、それ以外は
非網点候補領域と判定する。つぎに、この網点像領域の
結果を利用して補正を行う。これは、注目ブロックが非
網点候補領域と判定されたものであってもその周囲のブ
ロックの多くが網点候補領域であれば、網点像領域内の
ものである可能性が大きいからであり、この場合は前記
注目ブロックを網点像領域とする補正である。
【0102】逆に、注目ブロックが網点候補領域のもの
であると判定されたものであっても、その注目ブロック
の周囲のブロックの多くが非網点候補であると判定され
ていれば、網点像領域のブロックでない可能性が非常に
高いことになるため、この注目ブロックを非網点候補に
変更する補正をする。
【0103】つまり、入力画像について所定画素ブロッ
ク単位に分け、各ブロックについてピーク画素検出を行
い、これよりそのブロックが網点候補/非網点候補のい
ずれであるか判別を行い、この判別結果について隣接ブ
ロックの状態から網点候補/非網点候補の変更補正を施
してからそのブロックについて網点/非網点の判定を行
うことで網点領域検出をすることが出来る。
【0104】このようにして網点領域検出とエッジ領域
検出を行ったならば、つぎにこれらの結果を用いた総合
判定をする。この総合判定は、エッジ領域検出処理結果
と網点領域検出処理結果を用いての文字像領域/網点像
領域/写真像領域の判定である。
【0105】すなわち、エッジ領域検出で、エッジ領域
と判定され、かつ、網点領域検出で非網点領域と判定さ
れた領域は文字像領域とし、その他の領域を絵柄像領域
(網点像領域/写真像領域)とする。そして、絵柄像領
域である場合には、網点候補と判定されているとき、エ
ッジ/非エッジの判定にかかわりなく網点像領域の画像
であると判断し、エッジ/非エッジの判定結果がエッジ
であった場合には網点候補であるなしにかかわりなく写
真像領域の画像であると判断する。
【0106】以上の処理で領域分離装置2Aは、入力画
像信号を文字像領域と写真像領域と網点像領域に分割し
て出力することが出来る構成となる。本システムでは領
域分離装置2Aは、文字像領域と判定した信号について
は濃度レベル別領域分類装置3に与え、写真像領域と判
定した信号については写真画像出力装置6を介して写真
画像用符号化装置12に与え、網点像領域と判定した信
号については網点画像出力装置7を介して網点画像用符
号化装置19に与える構成としてある。
【0107】ここで網点画像出力装置7は領域分離装置
2Aから与えられた網点像領域の信号を一時保持して網
点画像用符号化装置19に与える装置であり、網点画像
用符号化装置19はこの網点画像出力装置7を介して与
えられた網点像領域の画像信号を符号化する装置であ
り、網点像領域の画像信号をJPEGと同様の方式で符
号化するものである。ただし、直交変換、例えば、DC
T変換後のDCT係数のうち、網点そのものを表現して
いる周波数成分の項(これをkとする)以上の高い周波
数成分の項(k以上の高い周波数成分の項k+1,k+
2,…)の値を“0”なるデータ値に置き換えてからJ
PEG方式と同様に符号化を行う。つまり、網点そのも
のを現している空間周波数成分を越える高周波数成分は
カットする。
【0108】記憶装置13には、上記文字画像用符号化
装置11、写真画像用符号化装置12、網点画像用符号
化装置19が符号化して出力する各符号化画像信号を記
憶するようにするが、各符号化画像信号を1枚の画像中
におけるそれぞれの位置や種別等がわかるように記憶す
る。
【0109】このような構成において、写真、網点画
像、文字の混在する原稿をイメージスキャナ1で読み取
らせる。イメージスキャナ1はこの原稿をライン単位で
順次スキャンしながら読取り、この読み取った画像を順
次例えば256階調のモノクロームの画像信号(あるい
はカラー画像信号でも可)に変換して出力する。
【0110】イメージスキャナ1から出力された多階調
の画像信号は、領域分離装置2Aに入力され、領域分離
装置2Aではこの画像信号について文字像領域相当部分
と写真像領域相当部分および網点像領域相当部分に分離
する。すなわち、この分離によって、原稿の画像信号は
写真像領域部分のみの画像信号、網点像領域部分のみの
画像信号、文字像領域部分のみの画像信号に分けられ
る。
【0111】このときの領域の判別にはモノクロームの
画像信号の場合は輝度レベルを用いて、また、原色系カ
ラー信号の場合はRGBの画像信号のうち、G成分の信
号を用いる。これはG成分の信号が輝度信号の代わりに
使用できるからである。
【0112】そして、G成分あるいは輝度レベルを利用
して画像中の文字像領域の判別には、エッジ領域検出の
手法により、網点像領域の判別には網点画像の特質を利
用した濃度レベルのピーク画素検出方法によりその判別
結果を元にして行う。そして、文字像領域でもなく、網
点像領域でもない残りの領域を写真画像として判別す
る。
【0113】このようにして領域分離装置2Aでは画像
信号について文字像領域相当部分と写真像領域相当部分
および網点像領域相当部分に分離し、文字像領域相当部
分の画像信号は濃度レベル別領域分類装置3に、写真像
領域相当部分の画像信号は写真画像出力装置6に、網点
像領域相当部分の画像信号は網点画像出力装置7に出力
する。
【0114】そして、網点像領域相当部分の画像信号に
ついては濃度レベル別領域分類装置3により上述の実施
例1,実施例2と同様に1画面分の文字像領域の信号に
ついて全体を一定間隔でサンプリングすることにより、
文字画像中の同じ濃度レベルの画素が占める領域を分離
する。そして、濃度レベル別に分類された文字像領域の
画像信号は、文字領域信号変換装置4において二値化さ
れる。ここでは分類された濃度レベル(背景色)を上述
同様に例えば、基準値“0”、文字の濃度レベルを
“1”として二値化する。そして、元の濃度レベルの値
と共に、この二値化したものを二値画像データ出力装置
5に出力する。二値画像データ出力装置5ではこの二値
化して与えられたデータの最初の2バイトに、背景の濃
度レベル値と文字の濃度レベル値を付加した図3に示す
如きフォーマットでデータを文字画像用符号化装置11
に出力する。そして、文字画像用符号化装置11ではこ
のデータをランレングス符号化処理する。
【0115】一方、領域分離装置2によって分離された
写真像領域の画像信号は、写真画像出力装置6に送ら
れ、ここで一旦バッファリングされた後、写真画像用符
号化装置12に送られ、ここでJPEG方式により符号
化される。
【0116】また、領域分離装置2は写真像領域につい
ては画素毎の濃度レベル対応の値にした多値の画像デー
タとして出力する。この結果、文字像領域の画像につい
て、その背景相当の領域の濃度レベルのほぼ等しいもの
単位で領域が分割され、その分割されたものについてそ
れぞれ背景濃度レベルと文字濃度レベルの値を先頭に、
これら背景と文字を二値化した画像データに変換したも
のが輪郭画像に適した符号化形式で符号化され、写真像
領域については画素毎の濃度レベル対応の値にした多値
の画像データとして出力されたものが写真等に適した符
号化形式で符号化されることになる。
【0117】また、領域分離装置2Aによって分離され
た網点像領域の画像信号は、網点画像出力装置7により
一旦バッファリングされ、網点画像用符号化装置19に
送られ、ここでJPEG方式により符号化される。ただ
し、直交変換、例えば、DCT変換後のDCT係数のう
ち、網点そのものを表現している周波数成分の項(これ
をkとする)より高い周波数成分の項(k以上の高い周
波数成分の項k+1,k+2,…)の値を“0”なるデ
ータ値に置き換えてからJPEG方式と同様に符号化を
行う。つまり、網点そのものを現している空間周波数成
分以上の高周波数成分はカットする。この結果、網点像
領域の画像信号は画質に余り影響のない空間周波数の高
い周波数成分をカットした高圧縮率の符号化がなされた
データとなる。
【0118】記憶装置13には、上記文字画像用符号化
装置11、写真画像用符号化装置12、網点画像用符号
化装置19が符号化して出力する各符号化画像信号が記
憶される。
【0119】画像の復元は、記憶装置13より保存され
ている符号化データをそれぞれ読み出して復号化処理を
行う。絵柄像領域の符号化データつまり、写真や網点画
像の領域の符号化データはJPEGにより符号化されて
いるデータであるから、JPEG復号化器である多階調
画像復号化装置14によりJPEG復号化を行い、文字
像領域の符号化データはランレングス符号化されたデー
タであるから、ランレングス復号化器である文字領域復
号化装置15でランレングス復号化処理を行う。
【0120】文字領域復号化装置15では復号したデー
タについて、さらに濃度レベル値部分の情報を参照して
元の階調の濃度データに戻す。このようにして、復号化
された画像を画像データ合成装置17で1枚の画像に合
成した後に、表示装置18で画像データを表示する。
【0121】以上のように、実施例3によれば、文字や
写真、網点画像等のような性質の異なる複数の像領域が
一枚の画像に混在する画像を圧縮する場合、像を文字像
領域と写真像領域と網点像領域に分離し、分離した像そ
れぞれについて画像の特性に合わせて符号化すること
で、単純に一種類の圧縮方法を用いた場合に比べ、圧縮
率を大幅に改善することができるようになるばかりでな
く、中間調の背景中に文字があるような場合でも、この
ような文字像領域の画像については、背景の濃度レベル
別に領域を分割してこの分割した領域のデータについて
二値化しており、しかも、背景濃度レベル値(その領域
での背景濃度レベル値の代表値)と文字濃度レベル値
(その領域での文字濃度レベル値の代表値)をその領域
のデータの先頭に付加して送るようにしているので、再
生時には復号化したデータについてこの背景濃度レベル
値と文字濃度レベル値を使用して二値データを多値デー
タに復元した後、各領域の復元データと写真像領域の復
号化データとを合成して元の一枚の画像に復元すること
で、中間値濃度の背景等を含む文字画像は文字画像とし
てその背景濃度を損なうことなく輪郭のはっきりした像
として再現できるようになり、従って、文字像領域が中
間値濃度の背景を含む場合でも、再現性のよい画像を得
ることのできる画像符号化・復号化処理を行うことがで
きるシステムが提供できるようになる。
【0122】以上、種々の実施例を説明したが、上述の
実施例に限定されるものではなく、種々変形して実施す
ることができる。なお、本実施例にはつぎの実施態様も
含まれる。
【0123】[1] 1画面に文字像と写真像等の絵柄
像とが混在した文書・写真混在多階調画像信号を複数の
領域に分割する装置であって、入力画像信号を(画像の
エッジ検出とそのエッジの連続性に基づいて)絵柄像領
域と文字像領域に分離する画像領域分離装置と、この分
離された文字像領域内の画像信号をほぼ同一濃度レベル
の領域毎に分ける分類装置と、この分類装置により分け
られたほぼ同一濃度レベルの領域毎にその画像信号につ
いてその濃度レベルに応じて二値化すると共に、この二
値化したデータを二値化時の代表的な濃度レベル情報と
ともに出力する変換装置とより構成するもの。
【0124】このような構成によれば、画像領域分離装
置により、入力画像信号を絵柄像領域と文字像領域に分
離すると共に、この分離された文字像領域内の画像信号
を分類装置によりほぼ同一濃度レベルの領域毎に分け、
変換装置では、この分けられたほぼ同一濃度レベルの領
域毎にその画像信号についてその濃度レベルに応じて二
値化すると共に、この二値化したデータを二値化時の代
表的な濃度レベル情報とともに出力することができる。
【0125】従って、画像信号内に文字や写真等のよう
な性質の異なる複数の領域が混在する場合に、画像の圧
縮のための符号化処理を行う前に特性に合わせて画像を
領域分割することで、分割した領域毎に最適な符号化処
理を施すことができるようになる。また、中間調で表現
された文字像領域の画像のデータを中間調を失うことな
く二値化することが可能となる。
【0126】画像信号内に文字や写真等のような性質の
異なる複数の領域が混在する場合に、画像の圧縮のため
の符号化処理を行う前に文字像領域部分や絵柄像(写真
等)領域部分などの像の特性に合わせて画像を領域分割
することで、後段では写真像領域については多値の画像
データをJPEGなどのような直交変換(DCT変換)
処理,ハフマン符号化処理を施して圧縮符号化する写真
画像に適用して最適な符号化処理手法で圧縮処理するこ
とができ、文字像領域については輪郭画像について輪郭
のボケを生じることなく高い効率で圧縮符号化できるラ
ンレングス符号化による圧縮符号化を施すことができる
ようになる。
【0127】しかも、文字像領域の画像については、背
景の濃度レベル別に分割してこれを二値化しており、背
景濃度レベル値と文字濃度レベル値をその領域のデータ
の先頭に付加して出力するようにしたので、文字像領域
についてその背景色の状態が異なるものであっても、そ
れが再現できるようにして二値化できており、従って、
中間調で表現された文字像領域の画像のデータを中間調
を失うことなく二値化することが可能となる。そして、
これを符号化して圧縮したものを、復号化するに際して
は、復号化したデータについてこの背景濃度レベル値と
文字濃度レベル値を使用して二値データを多値データに
復元した後、各領域の復元データと写真像領域の復号化
データとを合成して元の一枚の画像に復元することで、
中間値濃度の背景等を含む文字画像は文字画像としてそ
の背景濃度を損なうことなく輪郭のはっきりした像とし
て再現できるようになり、文字像領域が中間値濃度の背
景を含む場合でも、再現性のよい画像を得ることのでき
る画像領域別のデータ化処理を行うことができるように
なる。
【0128】なお、本構成は、画像データベース装置な
どに適用し、高画質と高い圧縮率を両立させるための前
処理を行うに最適であり、種々の用途に応用できる。 [2] 上記[1]項の装置であって、画像領域分離装
置において入力画像信号の隣合う画素間の色空間上の距
離を求めることにより、文字像領域と絵柄像領域に分離
することを特徴とするもの。
【0129】文字像は輪郭がはっきりしており、一方、
写真や網点像等の絵柄像は隣合う画素間での濃度変化が
緩い場合が多く、従って、隣合う画素間の色空間上の距
離の大小を元にその輪郭の境界と長さを調べることで、
容易に文字像領域と絵柄像領域に分離することができる
ようになる。
【0130】[3] 上記[1]項の装置であって、画
像領域分離手段において入力画像信号がモノクローム多
階調の信号であった場合、隣合う画素間の濃度レベルの
大きさを求めることにより、文字像領域と絵柄像領域に
分離することを特徴とする。
【0131】文字像は輪郭がはっきりしており、一方、
写真や網点像等の絵柄像は隣合う画素間での濃度変化が
緩い場合が多く、従って、隣合う画素間の濃度レベルの
大小を元にその輪郭の境界と長さを調べることで、容易
に文字像領域と絵柄像領域に分離することができるよう
になる。
【0132】[4] 上記[1]項の装置であって、画
像分類装置において文字像領域中の同一濃度レベルを分
類するために、文字像領域の全画像領域について一定の
距離間隔でサンプリングする。
【0133】文字像領域の全画像領域について一定の間
隔でサンプリングすることにより、文字像領域全体の濃
度レベル分布が分かり、ほぼ同一の濃度レベル域毎に分
ける処理が行える。そして、サンプリングは一定の距離
間隔で行うことから、全体のサンプリング数は少なくて
済むから、処理時間を短縮することができるようにな
る。
【0134】
【発明の効果】以上、詳述したように、本発明によれ
ば、画像信号内に文字や写真等のような性質の異なる複
数の領域が混在する場合に、画像の圧縮のための符号化
処理を行う前に特性に合わせて画像を領域分割すること
で、分割した領域毎に最適な符号化処理を施すことがで
きるようになる他、中間調で表現された文字像領域が存
在する場合にも、その文字画像のデータを中間調を失う
ことなく二値化することが可能となるなど、符号化効率
の高い、しかも、画質の劣化の少ない画像圧縮符号化・
復号化が可能なデータ処理装置を提供できる。
【図面の簡単な説明】
【図1】本発明の実施例を説明するための図であって、
本発明の実施例1の全体構成を示すブロック図。
【図2】本発明の実施例を説明するための図であって、
本発明の実施例1の作用を説明するための図。
【図3】本発明の実施例を説明するための図であって、
本発明の実施例1の作用を説明するための図。
【図4】本発明の実施例を説明するための図であって、
本発明の実施例2の全体構成を示すブロック図。
【図5】本発明の実施例を説明するための図であって、
本発明の実施例3の全体構成を示すブロック図。
【符号の説明】
1…イメージスキャナ、2,2A…領域分離装置、3…
濃度レベル別領域分類処理装置、4…文字領域信号変換
装置、5…二値画像データ出力装置、6…写真画像の出
力装置、11…文字画像用符号化装置、12…写真画像
用符号化装置、13…記憶装置、14…多階調画像復号
化装置、15…文字領域復号化装置、16…画像変換装
置、17…画像合成装置、18…表示装置、19…網点
画像用符号化装置。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 1画面に文書と絵柄像が混在した文書・
    写真混在多階調画像信号を複数の領域に分割するデータ
    処理装置において、 入力画像信号を絵柄像領域と文字像領域に分離する画像
    領域分離手段と、 この分離された文字像領域内の画像信号をほぼ同一濃度
    レベルの領域毎に分ける分類手段と、 この分類手段により分けられたほぼ同一濃度レベルの領
    域毎にその画像信号についてその濃度レベルに応じて二
    値化すると共に、この二値化したデータを二値化時の代
    表的な濃度レベル情報とともに出力する変換手段と、を
    具備したことを特徴とする文書・写真混在多階調画像の
    データ処理装置。
  2. 【請求項2】 1画面に文書と絵柄像が混在した文書・
    写真混在多階調画像信号を符号化・復号化処理するデー
    タ処理装置において、 入力画像信号を絵柄像領域と文字像領域に分離する画像
    領域分離手段と、 絵柄像領域の画像信号を符号化する絵柄画像符号化手段
    と、 前記画像領域分離手段により分離された文字像領域内の
    画像信号をほぼ同一濃度レベルの領域毎に分ける分類手
    段と、 この分類手段により分けられたほぼ同一濃度レベルの領
    域毎にその画像信号についてその濃度レベルに応じて二
    値化すると共に、この二値化したデータを二値化時の代
    表的な濃度レベル情報とともに出力する変換手段と、 この変換手段からの出力を符号化する文字像用符号化手
    段と、よりなる符号化処理系と、 前記文字像用符号化手段により符号化された文字像領域
    内の画像信号を復号化すると共に、二値化時の代表的な
    濃度レベル情報を用いて元の濃度レベルの画像信号に復
    元する復元処理手段と、 前記絵柄画像符号化手段により符号化された画像信号を
    復号化する復号化手段と、 この復号化手段により復号化された画像信号と前記復元
    処理手段により復元された画像信号を合成して元の1画
    面の画像信号にして出力する合成手段と、よりなる復号
    化処理系と、を具備することを特徴とする文書・写真混
    在多階調画像のデータ処理装置。
  3. 【請求項3】 画像分類手段は、文字像領域中のほぼ同
    一濃度レベルの領域を分けるために、文字像領域を一定
    間隔でサンプリングし、そのサンプリング値がほぼ同一
    濃度レベルの範囲をもって領域分けする構成とすること
    を特徴とする請求項1または2いずれか1項記載の文書
    ・写真混在多階調画像のデータ処理装置。
JP7105582A 1995-04-28 1995-04-28 文書・写真混在多階調画像のデータ処理装置 Pending JPH08307666A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7105582A JPH08307666A (ja) 1995-04-28 1995-04-28 文書・写真混在多階調画像のデータ処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7105582A JPH08307666A (ja) 1995-04-28 1995-04-28 文書・写真混在多階調画像のデータ処理装置

Publications (1)

Publication Number Publication Date
JPH08307666A true JPH08307666A (ja) 1996-11-22

Family

ID=14411503

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7105582A Pending JPH08307666A (ja) 1995-04-28 1995-04-28 文書・写真混在多階調画像のデータ処理装置

Country Status (1)

Country Link
JP (1) JPH08307666A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7330600B2 (en) 2002-09-05 2008-02-12 Ricoh Company, Ltd. Image processing device estimating black character color and ground color according to character-area pixels classified into two classes
JP2009027715A (ja) * 2007-07-20 2009-02-05 Sharp Corp 画像データの色補正方法及びシステム
JP2014068082A (ja) * 2012-09-24 2014-04-17 Kyocera Document Solutions Inc 画像形成装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7330600B2 (en) 2002-09-05 2008-02-12 Ricoh Company, Ltd. Image processing device estimating black character color and ground color according to character-area pixels classified into two classes
JP2009027715A (ja) * 2007-07-20 2009-02-05 Sharp Corp 画像データの色補正方法及びシステム
JP4649498B2 (ja) * 2007-07-20 2011-03-09 シャープ株式会社 画像データの色補正方法及びシステム
US8223395B2 (en) 2007-07-20 2012-07-17 Sharp Laboratories Of America, Inc. Methods and systems for refining text color in a digital image
JP2014068082A (ja) * 2012-09-24 2014-04-17 Kyocera Document Solutions Inc 画像形成装置

Similar Documents

Publication Publication Date Title
JP2720924B2 (ja) 画像信号の符号化装置
EP0685963B1 (en) Image processing apparatus and method
US6307962B1 (en) Document data compression system which automatically segments documents and generates compressed smart documents therefrom
US8331671B2 (en) Image processing apparatus and image encoding method related to non-photo image regions
JP4295882B2 (ja) デジタル画像データの区分方法並びにデータブロックの区分方法及び分類方法
US7184589B2 (en) Image compression apparatus
JP3237582B2 (ja) 画像処理装置及び画像処理方法
US7386168B2 (en) Image processing apparatus
US7184603B2 (en) System and method for lossless compression of digital images
JP2001223903A (ja) 走査された色付きおよびグレースケールの文書を圧縮する方法
US20080037883A1 (en) Image encoding apparatus and image decoding apparatus
JPH08228294A (ja) 画像圧縮装置及びデータ圧縮方法
US5442459A (en) Process for encoding a half tone image considering similarity between blocks
JP2006005939A (ja) スキャンされた文書用のセグメント化に基づくハイブリッド圧縮機構
US6744919B2 (en) Classification of blocks for compression based on number of distinct colors
US6628843B1 (en) Image enhancement on JPEG compressed image data
US7191103B2 (en) Predominant color identification in digital images
EP1006714A2 (en) Method of processing mixed raster content planes
JP3108133B2 (ja) カラー文書画像の適応符号化方式
JPH08307666A (ja) 文書・写真混在多階調画像のデータ処理装置
JPH08298589A (ja) 写真・文書混在画像の画像処理装置
JP3931468B2 (ja) 画像用領域分離装置および方法
JPH06178122A (ja) カラー画像の適応符号化装置
JPH04248766A (ja) 像域分離装置
JPH0393355A (ja) 文字領域分離方法および装置