JPH08307666A

JPH08307666A - 文書・写真混在多階調画像のデータ処理装置

Info

Publication number: JPH08307666A
Application number: JP7105582A
Authority: JP
Inventors: Masahiko Shibuya; 政彦渋谷
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1995-04-28
Filing date: 1995-04-28
Publication date: 1996-11-22

Abstract

(57)【要約】【目的】中間調の領域に黒文字や白抜き文字が存在する
ような画像形態であっても中間調の部分の再現できるよ
うに文字部分は文字画像の特徴に対応した最適な画像符
号化を施すことができるようにすること。【構成】１画面に文書と絵柄像が混在した多階調の画像
信号を複数の領域に分割するデータ処理装置において、
画像信号を絵柄像領域と文字像領域に分離する分離手段
２と、この分離された文字像領域内の画像信号をほぼ同
一濃度レベルの領域毎に分ける分類手段３と、この分類
手段により分けられたほぼ同一濃度レベルの領域毎にそ
の画像信号についてその濃度レベルに応じて二値化する
と共に、この二値化したデータを二値化時の代表的な濃
度レベル情報とともに出力する変換手段４，５とより構
成する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、文書・写真混在多階調
画像信号を文字像領域、写真像領域等の像の特徴に応じ
て別々に分けて処理できるようにしたデ−タ処理装置に
関するものである。

【０００２】

【従来の技術】画像情報は文字情報に比べると比較にな
らないほど膨大なデータ量を持つ。従って、画像情報を
伝送したり、記憶媒体に記憶するに際しては画像を符号
化して圧縮し、できるだけ容量を少なくする工夫がなさ
れている。

【０００３】画像を符号化する方法は従来から種々のも
のが考案され、実用化されているが、それぞれ長所と短
所がある。例えば、ファクシミリなどで用いられている
ＭＭＲ方式は、像の画質を劣化させることなく原画像信
号を符号化・復号化できるという長所があるが、この方
式は基本的にモノクローム（白黒）の二値画像用の符号
化方式であり、階調を持つ画像やカラー画像等のよう
に、多値のデータを必要とする画像（多値画像）には利
用できないという短所があって、主に文字画像の符号化
に向く符号化方式である。

【０００４】一方、多値画像の符号化方式としては、カ
ラー静止画の圧縮標準であるＪＰＥＧ(Joint Photograp
hic Coding Experts Grope) が知られている。このＪＰ
ＥＧは多階調（カラー画像を含む）の画像の符号化がで
きるが、画像データを所定画素単位のブロックに分割
し、各ブロックについて直交変換、例えば、離散コサイ
ン変換（Discrete Cosin Transform；以下、ＤＣＴ変換
と呼ぶ）処理することによって画像の持つ空間周波数成
分を垂直・水平周波数成分に変換した後に量子化し、こ
の量子化したものをハフマン符号化することにより、デ
ータ圧縮するようにしているために、この方式で符号化
した圧縮画像を復号化すると、復元された画像はその画
質が原画像よりも劣化してしまうという問題がある。例
えば、文字画像などのエッジ部分がぼやける傾向がある
といった具合である。

【０００５】このように、ＪＰＥＧは復号化して得られ
る画像が元の画像よりも劣化してしまう。ＪＰＥＧで画
質の劣化を防ぐ方法がないわけではなく、例えば、量子
化する際に量子化係数を変化させて符号化すれば改善さ
れる。しかし、量子化係数を変化させて符号化するとい
うことは、圧縮率を犠牲にするということを意味する。
従って、高圧縮率を要求される場合には向かないという
短所がある。

【０００６】しかし、ＪＰＥＧによる特徴的な画質劣化
は、像のエッジ部分がぼやける傾向があるというもので
あるから、劣化が目につきにくい写真画像の符号化には
このＪＰＥＧは適した符号化方式であるといえる。

【０００７】このように、像の種別により、最適な符号
化方式が異なる。一方、符号化する対象の原画像につい
て考えてみると、それは例えば、文字ばかりの原稿の像
である場合もあれば、写真とその説明の文章が一枚の画
像の中に混在するといったように、性質の異なる像領域
が一枚の画像の中に混在する場合もある。また、写真画
像についても新聞や雑誌等のように網点画像として印刷
したものや無段階階調変化の画像である写真そのもの等
があり、あるいはこれら網点画像や写真そのものの画像
が同じ画像中に混在する場合がある。

【０００８】このような網点画像や写真、文字が混在す
る場合、その画像を二値画像としてＭＭＲなどで圧縮す
ると写真部分の階調性が失われることが多く、ＪＰＥＧ
で圧縮すると文字画像部分での画質の劣化が目立ってし
まうという問題点がある。

【０００９】また、同じ写真部分の画像の符号化におい
ても、網点画像の場合にはＤＣＴ変換して得られる垂直
・水平周波数成分の高域成分のほとんどが網点のドット
に関する情報であるので、写真像領域と同一の方法で符
号化を行うと、高域成分の情報も符号化することとなる
ために、圧縮率が悪くなるといった問題があった。

【００１０】近年においては、文字や網点画像、写真等
が混在する画像を扱いたい例は極めて多く、特にパソコ
ンやファクシミリ、データベースなどが広範囲にわた
り、ごく当たり前に利用される現代の環境下では上述し
た問題が残されたままになっていることは大きな障害で
ある。

【００１１】従って、文字や網点画像、写真等が混在す
る画像を符号化するにあたっても、それぞれの像の画質
を損なうことなく、高圧縮率で画像の圧縮符号化がで
き、かつ、復元できるようにする技術の開発が嘱望され
ている。

【００１２】これに応える技術として、写真像や網点像
と文字像とを含む混在画像のデータから文字像領域のデ
ータと写真像および網点像等の画像領域のデータを領域
判別手段により、分けて抽出し、これをそれぞれ専用の
符号化装置で符号化することにより、それぞれの画像の
特徴に合わせた最適な符号化方法を適用できて、それぞ
れの像の画質を損なうことなく、高圧縮率で画像の圧縮
符号化ができ、かつ、復元できるようにする試みがなさ
れている。

【００１３】そこで重要となるのは、文字像領域のデー
タと、写真および網点像等の絵柄画像領域のデータを分
離する技術である。そして、この分離法は従来から多数
考案されている。

【００１４】例えば、文字像領域と写真像領域と網点像
領域に分離分割する手法である像域分離処理の例として
は、明確な輪郭を必ず備えているという文字パターンの
特徴を活かしたエッジ領域検出処理と、網点の集合で画
像を表現する網点画像の検出を行う網点領域検出処理を
併用し、当該二つの処理の結果の総合判定により文字像
領域か絵柄像領域（網点像領域、写真像領域）かを判別
する手法が合理的である。

【００１５】エッジ領域検出処理と網点領域検出処理結
果の総合判定により、例えば、エッジ領域検出ができて
網点領域検出ができなかった時は文字像領域の画像であ
ると判断し、網点領域検出ができた場合は、エッジ領域
検出が出来る出来ないにかかわりなく網点像領域の画像
であると判断し、エッジ領域検出ができなかった場合に
は網点領域検出が出来る出来ないにかかわりなく写真像
領域の画像であると判断する。これにより、像の種別対
応の分離抽出が容易に実施可能である。

【００１６】ここで、エッジ領域検出は例えばつぎのよ
うにして行う。文字画像のデータは、濃度レベルが高レ
ベルと低レベルの画素（例えば、白地に黒で文字を書い
た場合には黒画素と白画素）が多く、かつ、エッジの部
分ではこれら濃度レベルが高レベルの画素と低レベルの
画素が連続している。一方、写真は多値情報であり、多
くの部分で中間値をとる。従って、濃度レベルが高レベ
ルの画素と低レベルの画素それぞれの連続性を調べれ
ば、エッジ領域であるか否かを検出することができる。

【００１７】具体的手法としては入力画像のデータを三
値化し、この三値化した画像について、濃度レベルが高
レベルの画素と低レベルの画素それぞれの連続性を調
べ、エッジ／非エッジを判定する。

【００１８】三値化は入力画像のデータにエッジ強調を
施した後、二種の固定閾値で比較して振り分けることに
よって高濃度画素、中間濃度画素、低濃度画素に分類
し、その分類した濃度対応のレベル値を与えることで実
現出来る。

【００１９】濃度レベルが高レベルの画素と低レベルの
画素それぞれの連続性を調べるには、三値化後の濃度レ
ベルが高レベルの画素と低レベルの画素が連続するとこ
ろを、パターンマッチングにて検出する。画像は３×３
画素のブロック単位で扱うものとすれば、上記ブロック
単位でその各画素について三値化した後、その三値化済
みブロックの画素のパターンを、パターンマッチングで
検出する。

【００２０】パターンマッチングは例えば、３×３画素
のブロックの画素について、高濃度レベルの画素の並び
が中心を通り、縦並びのもの、横並びのもの、斜めのも
の、低濃度レベルの画素の並びが中心を通り、縦並びの
もの、横並びのもの、斜めのもの等を基準のパターンと
して用意し、三値化済みブロックの画素の配置パターン
について、これらのパターンのいずれかに該当するもの
があるか否かを調べることで実現できる。なお、パター
ンは文字のエッジ部分が、ある方向性を持っていること
に着目して選ぶようにする。

【００２１】つぎに、エッジ／非エッジを判定するに
は、所定のブロック内において、パターンマッチングで
検出した高濃度レベルの画素および低濃度レベルの画素
が、両者とも所定の個数以上、存在する場合、注目のブ
ロックをエッジ領域とし、それ以外は非エッジ領域と判
定する。

【００２２】網点像領域の検出はつぎのようにして行
う。網点画像は絵を点で表現したものであるから、その
濃度分布はあたかも剣山の如く、円錐状の山（谷）が数
多くしかも、均一に存在している。この特性を利用して
網点とその他を分類する。すなわち、局所領域におい
て、網点の頂上と谷底にあたる画素（つまり、ピーク画
素）の密度が高く、それが均一に存在する部分を網点像
領域とする。

【００２３】ピーク画素の検出の具体的な手法はつぎの
通りである。例えば、画像を３×３画素のブロックに分
け、このブロックにおいて中心画素の濃度レベルＬが周
囲の全ての画素の濃度レベルより高い、あるいは低く、
かつ、Ｌと中心画素を挟んで対角線上に存在する対の画
素ａ，ｂの濃度レベルが、４対とも｜２×Ｌ−ａ−ｂ｜＞ＴＨ（但し、ＴＨは固定の閾値）なる条件を満たす場合、中
心画素をピーク画素とする。これでピーク画素が検出さ
れる。

【００２４】つぎに網点像領域の検出はつぎのようにし
て行う。所定のブロック内においてピーク画素が存在す
れば、注目のブロックを網点候補領域とし、それ以外は
非網点候補領域と判定する。つぎに、この網点像領域の
結果を利用して補正を行う。これは、注目ブロックが非
網点候補領域と判定されたものであってもその周囲のブ
ロックの多くが網点候補領域であれば、網点像領域内の
ものである可能性が大きいからであり、この場合は前記
注目ブロックを網点像領域とする補正である。

【００２５】逆に、注目ブロックが網点候補領域のもの
であると判定されたものであっても、その注目ブロック
の周囲のブロックの多くが非網点候補であると判定され
ていれば、網点像領域のブロックでない可能性が非常に
高いことになるため、この注目ブロックを非網点候補に
変更する補正をする。

【００２６】つまり、入力画像について所定画素ブロッ
ク単位に分け、各ブロックについてピーク画素検出を行
い、これよりそのブロックが網点候補／非網点候補のい
ずれであるか判別を行い、この判別結果について隣接ブ
ロックの状態から網点候補／非網点候補の変更補正を施
してからそのブロックについて網点／非網点の判定を行
うことで網点像領域検出をすることが出来る。

【００２７】このようにして網点領域検出とエッジ領域
検出を行ったならば、つぎに総合判定する。この総合判
定は、エッジ領域検出処理結果と網点領域検出処理結果
を用いての文字像領域／網点像領域／写真像領域の判定
である。すなわち、エッジ領域検出で、エッジ領域と判
定され、かつ、網点領域検出で非網点領域と判定された
領域は文字像領域とし、その他の領域を絵柄像領域（網
点像領域／写真像領域）とする。そして、絵柄像領域で
ある場合には、網点候補と判定されているとき、エッジ
／非エッジの判定にかかわりなく網点像領域の画像であ
ると判断し、エッジ／非エッジの判定結果がエッジであ
った場合には網点候補であるなしにかかわりなく写真像
領域の画像であると判断する。

【００２８】

【発明が解決しようとする課題】文書・写真画像が混在
する画像信号を圧縮符号化処理するためには、画像信号
それぞれの特性にあわせて処理（符号化・復号化・フィ
ルタ処理等）を行った方が一枚の画像として画像を取り
扱うよりもその部分に対して最適な処理を施せる。そこ
で、このような文書・写真画像が混在する画像信号を圧
縮符号化処理するにあたり、文書や写真画像等のように
性質の異なる像領域の画像信号を像領域別に分離するこ
とが行われる。

【００２９】このような文書・写真混在画像を分離する
ための方法としては従来から多数考案されており、例え
ばエッジ領域検出による文字領域検出方法や、ピーク画
素検出による網点領域検出法を併用して、その検出結果
から総合的に判断することで、文書・写真混在画像を種
別対応に分離抽出する技術があげられる。

【００３０】そして、この技術はエッジ領域検出では、
文字画像の特性（文字画像ではその濃度レベルが高レベ
ル（白）と低レベル（黒）にはっきりと分かれ、かつエ
ッジ部分では黒画素と白画素が連続している）と、写真
画像の特性（写真画像では濃度レベルが中間レベルをと
ることが多い）に着目して、これらの特性を利用するこ
とにより、文字像領域と写真像領域の検出を行ってい
る。

【００３１】ところで、原稿をイメージスキャナで読み
取って画像デ−タ化する場合を考えてみると、それは例
えば、写真とその説明文が一枚の画像の中に混在すると
いったように、性質の異なる像領域が一枚の画像の中に
混在する場合や、文字が濃度レベルが中間調で表現され
ている場合、濃度レベルが中間調の領域中に黒文字や白
文字が存在する場合など様々である。そして、文字像領
域の画像に中間調の領域が存在する場合に問題が大き
い。

【００３２】すなわち、分割後の文字像領域のデータは
後処理の関係上、二値データ化して取り扱うようにする
ことが多く、従って、後処理時に二値化してしまうこと
により、中間調データが失われてしまうという問題であ
る。

【００３３】従って、中間調の領域に黒文字や白抜き文
字が存在するような画像形態であっても文字部分は文字
画像の特徴に対応した最適な画像符号化を施すことがで
き、また、中間調の部分は、中間調が再現できるような
最適な画像符号化を施すことができるようにする手法の
確立が望まれている。

【００３４】そこでこの発明の目的とするところは、一
枚の画面中に文字像領域部分や写真像領域部分が混在す
る画像であって、しかも、文字が中間調の背景の中に埋
もれるような画像像領域を含む画像であっても、文字は
文字、中間調は中間調の特徴を失うことのない最適なデ
ータに処理して出力することができるようにした文書・
写真混在画像のデータ処理装置を提供することにある。

【００３５】

【課題を解決するための手段】上記目的を達成するた
め、本発明はつぎのように構成する。すなわち、第１に
は、１画面に文書と絵柄像が混在した多階調の画像信号
を複数の領域に分割するデータ処理装置において、画像
信号を絵柄像領域と文字像領域に分離する画像領域分離
手段と、この分離された文字像領域内の画像信号をほぼ
同一濃度レベルの領域毎に分ける分類手段と、この分類
手段により分けられたほぼ同一濃度レベルの領域毎にそ
の画像信号についてその濃度レベルに応じて二値化する
と共に、この二値化したデータを二値化時の代表的な濃
度レベル情報とともに出力する変換手段とより構成す
る。

【００３６】第２には、１画面に文書と絵柄像が混在し
た多階調の画像信号を複数の領域に分割して符号化・復
号化処理するデータ処理装置において、画像信号を絵柄
像領域と文字像領域に分離する画像領域分離手段と、絵
柄像領域の画像信号を符号化する絵柄画像符号化手段
と、前記画像領域分離手段により分離された文字像領域
内の画像信号をほぼ同一濃度レベルの領域毎に分ける分
類手段と、この分類手段により分けられたほぼ同一濃度
レベルの領域毎にその画像信号についてその濃度レベル
に応じて二値化すると共に、この二値化したデータを二
値化時の代表的な濃度レベル情報とともに出力する変換
手段と、この変換手段からの出力を符号化する文字像用
符号化手段と、よりなる符号化処理系と、前記文字像用
符号化手段により符号化された文字像領域内の画像信号
を復号化すると共に、二値化時の代表的な濃度レベル情
報を用いて元の濃度レベルの画像信号に復元する復元処
理手段と、前記絵柄画像符号化手段により符号化された
画像信号を復号化する復号化手段と、この復号化手段に
より復号化された画像信号と前記復元処理手段により復
元された画像信号を合成して元の１画面の画像信号にし
て出力する合成手段と、よりなる復号化処理系と、を具
備する構成とする。

【００３７】

【作用】上記の第１の構成においては、画像領域分離手
段により、入力画像信号を絵柄像領域と文字像領域に分
離すると共に、この分離された文字像領域内の画像信号
を分類手段によりほぼ同一濃度レベルの領域毎に分け、
変換手段では、この分けられたほぼ同一濃度レベルの領
域毎にその画像信号についてその濃度レベルに応じて二
値化すると共に、この二値化したデータを二値化時の代
表的な濃度レベル情報とともに出力するようにした。

【００３８】従って、画像信号内に文字や写真等のよう
な性質の異なる複数の領域が混在する場合に、画像の圧
縮のための符号化処理を行う前に文字像領域部分や写真
等のような絵柄像領域部分などの像の特性に合わせて画
像を領域分割することで、分割した領域毎に最適な符号
化処理を施すことができるようになる。また、分類手段
と変換手段を設けて文字像領域を背景の濃度レベル対応
に領域分けし、その濃度レベルに応じて二値化すると共
に、この二値化したデータを二値化時の代表的な濃度レ
ベル情報とともに出力するようにしたので、文字像領域
についてその背景色の状態が異なるものであっても、そ
れが再現できるようにして二値化でき、従って、中間調
で表現された文字像領域の画像のデータを中間調を失う
ことなく二値化することが可能となる。

【００３９】上記の第２の構成においては、画像領域分
離手段により、入力画像信号を絵柄像領域と文字像領域
に分離すると共に、この分離された文字像領域内の画像
信号を分類手段によりほぼ同一濃度レベルの領域毎に分
け、変換手段では、この分けられたほぼ同一濃度レベル
の領域毎にその画像信号についてその濃度レベルに応じ
て二値化すると共に、この二値化したデータを二値化時
の代表的な濃度レベル情報とともに出力する。そして、
この変換手段からの出力を文字像用符号化手段により符
号化する。また、画像領域分離手段により分離された絵
柄像領域の画像信号は絵柄画像符号化手段により符号化
される。

【００４０】このようにして符号化処理された画像信号
を復号化するにあたっては、まず、前記文字像用符号化
手段により符号化された文字像領域内の画像信号は復元
処理手段により復号化すると共に、二値化時の代表的な
濃度レベル情報を用いて元の濃度レベルの画像信号に復
元し、絵柄画像符号化手段により符号化された画像信号
は復号化手段により復号化する。そして、この復号化手
段により復号化された画像信号と前記復元処理手段によ
り復元された画像信号は合成手段に与えられ、ここで合
成して元の１画面の画像信号にして出力する。

【００４１】このように、第２の構成においては、入力
画像信号を絵柄像領域と文字像領域に分離すると共に、
この分離された文字像領域内の画像信号を分類装置によ
りほぼ同一濃度レベルの領域毎に分け、変換装置では、
この分けられたほぼ同一濃度レベルの領域毎にその画像
信号についてその濃度レベルに応じて二値化すると共
に、この二値化したデータを二値化時の代表的な濃度レ
ベル情報とともに出力するようにした。

【００４２】従って、画像信号内に文字や写真等のよう
な性質の異なる複数の領域が混在する場合に、画像の圧
縮のための符号化処理を行う前に文字像領域部分や絵柄
像（写真等）領域部分などの像の特性に合わせて画像を
領域分割することで、分割した領域毎に最適な符号化処
理を施すことができるようになる。また、分類装置と変
換装置を設けて文字像領域を背景の濃度レベル対応に領
域分けし、その濃度レベルに応じて二値化すると共に、
この二値化したデータを二値化時の代表的な濃度レベル
情報とともに出力するようにしたので、文字像領域につ
いてその背景色の状態が異なるものであっても、それが
再現できるようにして二値化でき、従って、中間調で表
現された文字像領域の画像のデータを中間調を失うこと
なく二値化することが可能となる。

【００４３】

【実施例】以下、本発明の実施例について、図面を参照
して説明する。本発明は、文字や、写真像などの混在画
像の画像信号を、文字、写真などの種別対応に領域分割
して振り分け、それぞれの像の特徴を失うことのないよ
うに、しかも、符号化処理の段階で十分な符号化効率
（圧縮効率）を確保できるようなデータ形式にデータ化
して出力する装置であり、中間調の背景に文字があるよ
うなケースであっても、文字は文字、中間調領域は中間
調の特徴を失わないようにデータ化することができるよ
うにしたもので、以下、詳細を説明する。

【００４４】（実施例１）図１は、本発明による文書・
写真混在多階調画像の像域分離装置の構成を示すブロッ
ク図であり、図中１はイメージスキャナ、２は領域分離
装置、３は濃度レベル別領域分類処理装置、４は文字領
域信号変換装置、５は二値画像データ出力装置、６は写
真画像の出力装置である。

【００４５】これらのうち、イメージスキャナ１は、原
稿の像を読み取って画像信号を生成するものであり、モ
ノクローム（単一色）用のイメージスキャナである。画
像信号は２５６階調とし、階調レベル“０”が最も暗い
ことを、階調レベル“２５５”が最も明るいことを示す
ものとする。本実施例では説明の簡単化のために、画像
信号は写真画像と文字画像が混在したモノクローム多階
調で表現されている信号であるものとする。

【００４６】領域分離装置２はイメージスキャナ１の出
力する画像信号を受けて、この画像信号を文字画像と写
真画像に領域分離して出力する装置であって、上記画像
信号を２種類の領域に分割し、その結果を領域分割信号
として出力するものである。ここでは、画像信号を文字
像領域と写真像領域に分割する。

【００４７】なお、領域分離装置２は入力画がカラーの
場合にも拡張することが可能である。例えば、イメージ
スキャナ１をカラーイメージスキャナとすれば、得られ
る画像信号かカラー画像信号とすることができ、このよ
うに入力画像信号がカラー画像信号の場合には、入力画
像信号の隣合う画素間の色空間上の距離を求め、この色
空間上の距離の大きさの関係から、文字像領域と写真像
領域に分離することができる。

【００４８】具体的には、カラー画像中の文字像領域と
写真像領域の分離を実施するには、隣合う画素の色空間
上の距離から文字のエッジを検出する方法を用いる。モ
ノクローム多階調画像中の文字像と写真像の領域分離を
実施する場合では、隣合う画素の濃度レベルの差から文
字のエッジを検出する方法を利用した方式を使用する。

【００４９】濃度レベル別領域分類処理装置３は文字像
領域中の同じ濃度レベルの領域を分類するための装置で
あり、文字像領域を一定間隔でサンプリングすることに
よって濃度レベル毎の領域分類を行う。

【００５０】文字領域信号変換装置４は文字像領域の画
像信号の二値化データ変換装置であり、画像信号のうち
の文字像領域に属する部分の画像信号を二値のデータ
（二値画像データ）に変換する装置である。画像信号の
二値化には色々な方法があるが、ここでは一定のしきい
値を用意し、画像信号の値がこのしきい値より小さな値
ならば“０”とし、大きな値ならば“１”とする単純二
値化の手法を用いるものとする。文字像領域のための二
値化であるから、誤差拡散などの方法は適切ではない。
また、“０”は二値化を行う文字像領域中の濃度レベル
を基準とするものとする。

【００５１】二値画像データ出力装置５は二値画像デー
タを文字の画像データとわかるような形態のデータとし
て出力する装置であり、文字領域信号変換装置４によっ
て二値画像データに変換された文字像領域の信号（デー
タ信号）の最初の２バイトに、基準となる濃度レベル値
（“０”を示す値）と文字を示す濃度レベル値（“１”
を示す値）を付加して二値画像データを出力するための
装置である。

【００５２】写真画像出力装置６は領域分離装置２によ
り分離されて与えられる写真画像の領域の信号を濃度レ
ベル対応の多値のデータとして出力する装置であり、一
旦、バッファリングして写真画像の領域の画像信号とし
て後段に与えるものである。

【００５３】つぎに上記構成の本装置の作用を説明す
る。ここでは、文書をイメージスキャナ１で読み取って
その画像データを符号化（圧縮符号化）し、記憶装置に
記憶しておき、それを取り出して伸長して元の画像に復
元し、表示するような一種の画像データベース装置に本
発明を適用する例を説明する。

【００５４】ここでは画像処理を行う前に画像の分離を
行う例を示す。まず、原稿がイメージスキャナ１で読み
取られて、２５６階調のモノクローム画像信号が生成さ
れる。ここでは例として、図２（ａ）のような文字（文
章）と写真画像のある原稿３０をイメージスキャナ１で
読み取った場合について述べる。

【００５５】図２において、符号Ａ１を付した部分が写
真部分であり、符号Ａ２，Ａ３，Ａ４を付した部分がN
o.1，No.2，No.3の各文字像領域部分を示す。ここではN
o.1，No.2，No.3の各文字像領域Ａ２〜Ａ４部分は、濃
度がそれぞれ異なるものとする。

【００５６】イメージスキャナ１で読み取られた原稿は
２５６階調のモノクロ画像信号に変換されて領域分離装
置２に入力される。すると、領域分離装置２ではこの画
像信号について文字像領域と写真像領域に分割して、図
２（ｂ），（ｃ）のような領域分割した画像の信号が生
成される。このときの文字像領域の判別にはエッジ領域
検出処理の手法を用いる。そして、残りの領域を写真画
像として判別を行う。

【００５７】すなわち、エッジ領域検出は例えばつぎの
ようにして行う。文字画像のデータは、濃度レベルが高
レベルと低レベルの画素（例えば、白地に黒で文字を書
いた場合には黒画素と白画素）が多く、かつ、エッジの
部分ではこれら濃度レベルが高レベルの画素と低レベル
の画素が連続している。一方、写真は多値情報であり、
多くの部分で中間値をとる。従って、濃度レベルが高レ
ベルの画素と低レベルの画素それぞれの連続性を調べる
ことで、エッジ領域であるか否かを検出する。

【００５８】領域分離装置２はこのようにしてエッジ領
域とした画像信号については濃度レベル別領域分離装置
３に出力し、そして、エッジ領域とされなかった残りの
領域の信号は写真画像の画像信号として写真画像出力装
置６に送る。

【００５９】このようにして、領域分離装置２により領
域毎に分割されて出力された画像信号のうち、写真像領
域の画像信号は写真画像出力装置６より多値信号として
出力され、一方、文字像領域の画像信号は濃度レベル別
領域分離装置３において、一定間隔でサンプリングさ
れ、同じ濃度レベルの領域を分離する処理がなされる。

【００６０】すなわち、濃度レベル別領域分離装置３で
は１画面分の文字像領域の信号について全体を一定間隔
でサンプリングすることにより、文字画像中のほぼ同じ
濃度レベルの画素が占める領域を分離する。

【００６１】図２（ｄ），（ｅ），（ｆ）に濃度レベル
毎に分離された文字像領域の例を示す。ここで符号Ａ
２，Ａ３，Ａ４はそれそれ異なる濃度レベルの文字像領
域である。

【００６２】濃度レベル別領域分離装置３により濃度レ
ベル別に分類された文字像領域の画像信号は、文字領域
信号変換装置４において二値化される。ここでは、二値
化を行う際に、分類された濃度レベル（背景色）を基準
値“０”、文字の濃度レベルを“１”として二値化を行
う。そして、この二値化したものを二値画像データ出力
装置５に出力し、当該二値画像データ出力装置５ではこ
の二値化して与えられたデータの最初の２バイトに、背
景の濃度レベル値の代表値と文字の濃度レベル値の代表
値を付加して出力する。

【００６３】当該二値画像データ出力装置５の出力デー
タ構成例を図３に示す。ここで、符号Ｄ１，Ｄ２を付し
た部分はNo.1の文字像領域Ａ２の背景濃度レベルの代表
値と文字濃度レベルの代表値のデータ格納部を示してお
り、符号Ｄ３，Ｄ４を付した部分はNo.2の文字像領域Ａ
３の背景濃度レベルの代表値と文字濃度レベルの代表値
のデータ格納部を示しており、符号Ｄ５，Ｄ６を付した
部分はNo.3の文字像領域Ａ４の背景濃度レベルの代表値
と文字濃度レベルの代表値のデータ格納部を示してい
る。

【００６４】この結果、二値画像データ出力装置５から
は文字像領域の画像について、その背景相当の領域の濃
度レベルのほぼ等しいもの単位で領域が分割され、その
分割されたものについてそれぞれ背景濃度レベルの代表
値と文字濃度レベルの代表値を先頭に、これら背景と文
字を二値化した画像データに変換して出力し、写真像領
域については画素毎の濃度レベル対応の値にした多値の
画像データとして出力することになる。

【００６５】そのため、後段では写真像領域については
多値の画像データをＪＰＥＧなどのような直交変換（Ｄ
ＣＴ変換）処理，ハフマン符号化処理を施して圧縮符号
化する写真画像に適用して最適な符号化処理手法で圧縮
処理することができ、文字像領域については輪郭画像に
ついて輪郭のボケを生じることなく高い効率で圧縮符号
化できるランレングス符号化による圧縮符号化を施すこ
とができるようになる。

【００６６】しかも、文字像領域の画像については、背
景の濃度レベル別に分割してこれを二値化しており、背
景濃度レベル値と文字濃度レベル値をその領域のデータ
の先頭に付加して送るので、再生時には復号化したデー
タについてこの背景濃度レベル値と文字濃度レベル値を
使用して二値データを多値データに復元した後、各領域
の復元データと写真像領域の復号化データとを合成して
元の一枚の画像に復元することで、中間値濃度の背景等
を含む文字画像は文字画像としてその背景濃度を損なう
ことなく輪郭のはっきりした像として再現できるように
なり、文字像領域が中間値濃度の背景を含む場合でも、
再現性のよい画像を得ることのできる画像領域別のデー
タ化処理を行うことができるようになる。

【００６７】以上のように１画面に文字像と写真像等の
絵柄像とが混在した文書・写真混在多階調画像信号を複
数の領域に分割する装置であって、入力画像信号を（画
像のエッジ検出とそのエッジの連続性に基づいて）絵柄
像領域と文字像領域に分離する画像領域分離装置と、こ
の分離された文字像領域内の画像信号をほぼ同一濃度レ
ベルの領域毎に分ける分類装置と、この分類装置により
分けられたほぼ同一濃度レベルの領域毎にその画像信号
についてその濃度レベルに応じて二値化すると共に、こ
の二値化したデータを二値化時の代表的な濃度レベル情
報とともに出力する変換装置とより構成し、画像領域分
離装置により、入力画像信号を絵柄像領域と文字像領域
に分離すると共に、この分離された文字像領域内の画像
信号を分類装置によりほぼ同一濃度レベルの領域毎に分
け、変換装置では、この分けられたほぼ同一濃度レベル
の領域毎にその画像信号についてその濃度レベルに応じ
て二値化すると共に、この二値化したデータを二値化時
の代表的な濃度レベル情報を含めて出力するようにし
た。

【００６８】画像信号内に文字や写真等のような性質の
異なる複数の領域が混在する場合に、画像の圧縮のため
の符号化処理を行う前に文字像領域部分や絵柄像（写真
等）領域部分などの像の特性に合わせて画像を領域分割
することで、後段では写真像領域については多値の画像
データをＪＰＥＧなどのような直交変換（ＤＣＴ変換）
処理，ハフマン符号化処理を施して圧縮符号化する写真
画像に適用して最適な符号化処理手法で圧縮処理するこ
とができ、文字像領域については輪郭画像について輪郭
のボケを生じることなく高い効率で圧縮符号化できるラ
ンレングス符号化による圧縮符号化を施すことができる
ようになるなど、分割した領域毎に最適な符号化処理を
施すことができるようになる。

【００６９】また、分類装置と変換装置を設けて文字像
領域を背景の濃度レベル対応に領域分けし、その濃度レ
ベルに応じて二値化すると共に、この二値化したデータ
を二値化時の代表的な濃度レベル情報とともに出力する
ようにしたので、これを圧縮符号化し、復号化した際
に、文字像領域についてその背景色の状態が異なるもの
であっても、それが再現できるようにして二値化できて
おり、従って、中間調で表現された文字像領域の画像の
データを中間調を失うことなく二値化することが可能と
なる。

【００７０】つぎに実施例１の像域分離・データ化処理
技術を画像データベース装置などに適用した場合のシス
テム構成を実施例２として説明する。（実施例２）図４は写真付文書を多数蓄積して検索を可
能にする画像データベース装置などを構成するに最適な
システム構成例を示すブロック図である。

【００７１】図中、１はイメージスキャナ、２は領域分
離装置、３は濃度レベル別領域分類処理装置、４は文字
領域信号変換装置、５は二値画像データ出力装置、６は
写真画像の出力装置であり、これらは実施例１で説明し
たものと機能および構成は変わらない。１１は文字画像
用符号化装置、１２は写真画像用符号化装置、１９は網
点画像用符号化装置、１３は記憶装置、１４は多階調画
像復号化装置、１５は文字領域復号化装置、１６は画像
変換装置、１７は画像合成装置、１８は表示装置であ
る。

【００７２】これらのうち、文字画像用符号化装置１１
は、二値化画像信号変換装置５によって二値画像に変換
された文字像領域画像のデータの符号化装置であり、符
号化画像信号を生成する。ここでは、ランレングス符号
化方式を用いて符号化する。写真画像用符号化装置１２
は、写真画像の符号化装置であり、領域分離装置２が写
真像領域の画像デ−タと判定して分離出力したものを符
号化して符号化画像信号を生成するものである。ここで
は例えば、ＪＰＥＧ方式を用いて写真像領域の画像デー
タを符号化するようにしている。

【００７３】記憶装置１３は、上記文字画像用符号化装
置１１、写真画像用符号化装置１２が符号化して出力す
る各符号化画像信号を多数記憶しておくための装置であ
り、各符号化画像信号を１枚の画像中におけるそれぞれ
の位置や種別等がわかるように記憶される。

【００７４】多階調画像復号化装置１４は、記憶装置１
３から読み出された符号化画像信号を復号化して画像デ
ータ化する復号化装置であり、記憶装置１３から読み出
された符号化画像信号のうち、種別がＪＰＥＧ方式で符
号化されたものについて復号化するものであって、ＪＰ
ＥＧ方式で符号化された写真画像信号を復号化して、写
真画像信号を生成するものである。

【００７５】文字領域復号化装置１５は、記憶装置１３
から読み出された文字像領域の符号化画像信号を復号化
して画像信号化する復号化装置であり、ランレングス符
号化方式で符号化された画像信号を復号化して画像信号
を生成するものである。ランレングス符号化方式である
から、符号化する前の原画像の画像信号と復号化して得
た画像信号とは完全に一致し、符号化・復号化処理に伴
う画質劣化がない。また、文字領域復号化装置１５は、
復号化した文字像領域のデータフォ−マットが、先頭に
背景の濃度レベル値を、そしてつぎに文字の濃度レベル
値を格納し、そのあとに背景の画素のデータを“０”、
文字を“１”として二値化したデータが続く形式として
ある。

【００７６】そこで、画像変換装置１６は、二値化デー
タをこの濃度レベル値を利用して元の濃度レベル値に戻
す処理を実施し、元に戻した濃度レベル値による画像デ
ータにして画像合成装置１７に出力する構成としてあ
る。

【００７７】画像合成装置１７は各領域の復号化画像デ
ータを合成して１枚のもとの画像を生成するための装置
であり、多階調画像復号化装置１４と画像変換装置１６
からの復号化画像を合成して１枚の画像にする装置であ
る。表示装置１８は復号化画像信号を表示するための装
置であり、画像合成装置１７で合成された画像を表示す
るための装置である。

【００７８】つぎにこのような構成の装置の作用を説明
する。まず、原稿がイメージスキャナ１で読み取られ
て、２５６階調のモノクロ画像信号が生成される。原稿
は写真像領域部分と文字像領域部分とからなり、文字像
領域は部分によって中間調の背景色があるものとする。

【００７９】イメージスキャナ１で読み取られた原稿は
２５６階調のモノクロ画像信号に変換されて領域分離装
置２に入力される。すると、領域分離装置２ではこの画
像信号について文字像領域と写真像領域に分割して、文
字像領域のものは濃度レベル領域分離処理装置３に、そ
して、写真像領域のものは写真画像出力装置６に入力す
る。このときの文字像領域の判別にはエッジ領域検出処
理の手法を用いる。そして、残りの領域を写真画像とし
て判別を行う。

【００８０】このようにして、領域分離装置２により領
域ごとに分割された画像信号のうち、写真像領域の画像
信号は写真画像出力装置６に一旦蓄えられ、その後、多
値信号として写真画像用符号化装置に出力され、一方、
文字像領域の画像信号は濃度レベル別領域分離装置３に
おいて、一定間隔でサンプリングされ、同じ濃度レベル
の領域を分離する処理がなされる。

【００８１】すなわち、濃度レベル別領域分離装置３で
は１画面分の文字像領域の信号について全体を一定間隔
でサンプリングすることにより、文字画像中の同じ濃度
レベルの画素が占める領域を分離する。これにより、図
２（ｃ）に示す如き文字像領域の画像は、図２（ｄ），
（ｅ），（ｆ）に示す濃度レベルごとに分離された画像
信号になる。

【００８２】濃度レベル別領域分離装置３により濃度レ
ベル別に分類された文字像領域の画像信号は、文字領域
信号変換装置４において二値化される。ここでは分類さ
れた濃度レベル（背景色）を例えば、基準値“０”、文
字の濃度レベルを“１”として二値化を行う。そして、
元の濃度レベルの値と共に、この二値化したものを二値
画像データ出力装置５に出力する。すると当該二値画像
データ出力装置５ではこの二値化して与えられたデータ
の最初の２バイトに、背景の濃度レベル値と文字の濃度
レベル値を付加した図３に示す如きフォーマットでデー
タを文字画像用符号化装置１１に出力する。そして、文
字画像用符号化装置１１ではこのデータをランレングス
符号化処理する。

【００８３】一方、領域分離装置２によって分離された
写真像領域の画像信号は、写真画像出力装置６に送ら
れ、ここで一旦バッファリングされた後、写真画像用符
号化装置１２に送られ、ここでＪＰＥＧ方式により符号
化される。

【００８４】この結果、文字像領域の画像について、そ
の背景相当の領域の濃度レベルのほぼ等しいもの単位で
領域が分割され、その分割されたものについてそれぞれ
背景濃度レベルと文字濃度レベルの値を先頭に配置し、
これら背景と文字を二値化した画像データに変換した形
式のデータとなる。そして、二値化は輪郭画像に適した
符号化形式で符号化方式であり、文字像に最適な方式で
あり、写真像領域については画素毎の濃度レベル対応の
値にした多値の画像データとして出力されたものがＪＰ
ＥＧにより符号化されることによって写真等に適した符
号化形式で符号化されることになる。

【００８５】このようにして、文字画像用符号化装置１
１、多値画像用符号化装置１２それぞれで圧縮符号化さ
れたデータは、記憶装置１３に格納される。以上で圧縮
処理、圧縮画像の保存のステップは終了する。

【００８６】つぎに再生、すなわち、復号化と表示につ
いて説明する。画像信号の復号化を行うためには、記憶
装置１３に保存されている符号化データをそれぞれ読み
出してつぎの如き復号化処理を行う。絵柄像領域の符号
化データつまり、写真画像の領域の符号化データはＪＰ
ＥＧにより符号化されているデータであるから、ＪＰＥ
Ｇ復号化器である多階調画像復号化装置１４によりＪＰ
ＥＧ復号化を行い、文字像領域の符号化データはランレ
ングス符号化されたデータであるから、ランレングス復
号化器である文字領域復号化装置１５でランレングス復
号化処理を行う。

【００８７】文字領域復号化装置１５では復号したデー
タについて、さらに濃度レベル値部分の情報を参照して
元の階調の濃度データに戻す。すなわち、文字像領域の
データは背景の濃度レベル値と、文字部分の濃度レベル
値とを保持しており、背景のデータを“０”値に、そし
て、文字部分のデータを“１”値にするかたちで、二値
データ化してあるので、“０”値のデータを背景の濃度
レベル値に戻し、“１”値のデータを文字部分の濃度レ
ベル値に戻すことができる。

【００８８】このようにして、復号化された画像を画像
データ合成装置１７で１枚の画像に合成した後に、表示
装置１８で画像データを表示する。以上のように文字や
写真等のような性質の異なる複数の像領域が一枚の画像
に混在する画像を圧縮する場合、像を文字像領域と写真
像領域に分離し、分離した像それぞれについて画像の特
性に合わせて符号化することで、単純に一種類の圧縮方
法を用いた場合に比べ、圧縮率を大幅に改善することが
できるようになるばかりでなく、中間調の背景中に文字
があるような場合でも、このような文字像領域の画像に
ついては、背景の濃度レベル別に領域を分割してこの分
割した領域のデータについて二値化しており、しかも、
背景濃度レベル値と文字濃度レベル値をその領域のデー
タの先頭に付加して送るようにしているので、再生時に
は復号化したデータについてこの背景濃度レベル値と文
字濃度レベル値を使用して二値データを多値データに復
元した後、各領域の復元データと写真像領域の復号化デ
ータとを合成して元の一枚の画像に復元することで、中
間値濃度の背景等を含む文字画像は文字画像としてその
背景濃度を損なうことなく輪郭のはっきりした像として
再現できるようになり、従って、文字像領域が中間値濃
度の背景を含む場合でも、再現性のよい画像を得ること
のできる画像符号化・復号化処理を行うことができるシ
ステムが提供できるようになる。

【００８９】以上は、文字像領域と写真等の絵柄像領域
が１画面内に混在する画像について文字像領域と絵柄像
領域に分け、文字像領域の像については中間調が再現で
きるように背景濃度レベル別に領域を切り分け、各切り
分けた領域のデータには先頭に背景の濃度レベル値と文
字の濃度レベル値を保持させ、背景の濃度レベル値と文
字の濃度レベル値対応に“０”，“１”に置き換えて二
値化するようにして文字像領域の中間調の背景の再現性
を確保するようにしつつ、十分な圧縮率を確保するよう
にしたものであるが、絵柄像領域は写真そのものであっ
てもまた、網点画像であってもすべて一様に多値データ
化してこれを符号化し、復号化する構成であった。

【００９０】しかし、写真そのものと、網点画像では符
号化にあたり、区別して処理すると網点画像はさらに圧
縮率を高めることができる。そこで、つぎに写真そのも
のと、網点画像では符号化にあたり、区別して処理する
構成し、文字像領域については中間調の背景がある場合
に、その中間調の背景の再現性を確保するようにしつ
つ、十分な圧縮率を確保するようにした圧縮符号化効率
の一段と良い、しかも、再生画像の品位の高い写真・文
書混在画像の画像処理装置をつぎに説明する。

【００９１】（実施例３）実施例３の構成は図５に示す
如きであり、基本的には図４で説明した実施例２の構成
と同じである。実施例３では実施例２の構成に、さらに
網点画像の処理系を付加した。すなわち、実施例２にお
ける領域分離装置２は入力された画像信号を文字像領域
と写真像領域とに分離して出力するものであったが、こ
の実施例３では画像信号を文字像領域と写真像領域と網
点像領域に分離してそれぞれ別に出力する機能を備えた
領域分離装置２Ａとしている。

【００９２】文字像領域と写真像領域と網点像領域に分
離分割する具体的手法としては、従来より種々の方式が
考案されており、実用化されているのでこれら既存技術
を使用して行う。本発明ではエッジ領域検出処理と、ピ
ーク情報を利用した網点領域検出処理を利用し、両者の
検出結果を総合的に判断して領域を区別する方式を採用
する。ピーク情報を利用した網点領域検出処理は網点画
像に含まれる特有のピーク情報を利用したものであり、
ここでは自動領域判別のための画像信号としてものクロ
ーム画像であればその階調値（濃度レベル値）を、ま
た、ＲＧＢのカラー画像信号であればそのうちのＧ信号
を輝度情報の代わりに用いることとする。

【００９３】文字像領域と写真像領域と網点像領域に分
離分割する像域分離処理は、エッジ領域検出処理と網点
領域検出処理の二つからなり、そして、当該二つの処理
の総合判定により文字像領域か絵柄像領域（網点像領
域、写真像領域）かを判別する。例えば、エッジ領域検
出ができて網点領域検出ができなかった時は文字像領域
の画像であると判断し、網点領域検出ができた場合は、
エッジ領域検出が出来る出来ないにかかわりなく網点像
領域の画像であると判断し、エッジ領域検出ができなか
った場合には網点領域検出が出来る出来ないにかかわり
なく写真像領域の画像であると判断する。

【００９４】エッジ領域検出は例えばつぎのようにして
行う。文字画像のデータは、濃度レベルが高レベルと低
レベルの画素（例えば、白地に黒で文字を書いた場合に
は黒画素と白画素）が多く、かつ、エッジの部分ではこ
れら濃度レベルが高レベルの画素と低レベルの画素が連
続している。一方、写真は多値情報であり、多くの部分
で中間値をとる。従って、濃度レベルが高レベルの画素
と低レベルの画素それぞれの連続性を調べれば、エッジ
領域であるか否かを検出することができる。

【００９５】具体的手法としては入力画像のデータを三
値化し、この三値化した画像について、濃度レベルが高
レベルの画素と低レベルの画素それぞれの連続性を調
べ、エッジ／非エッジを判定する。

【００９６】濃度レベルが高レベルの画素と低レベルの
画素それぞれの連続性を調べるには、三値化後の濃度レ
ベルが高レベルの画素と低レベルの画素が連続するとこ
ろを、パターンマッチングにて検出する。画像は３×３
画素のブロック単位で扱うものとすれば、上記ブロック
単位でその各画素について三値化した後、その三値化済
みブロックの画素のパターンを、パターンマッチングで
検出する。

【００９７】パターンマッチングは例えば、３×３画素
のブロックの画素について、高濃度レベルの画素の並び
が中心を通り、縦並びのもの、横並びのもの、斜めのも
の、低濃度レベルの画素の並びが中心を通り、縦並びの
もの、横並びのもの、斜めのもの等を基準のパターンと
して用意し、三値化済みブロックの画素の配置パターン
について、これらのパターンのいずれかに該当するもの
があるか否かを調べることで実現できる。なお、パター
ンは文字のエッジ部分が、ある方向性を持っていること
に着目して選ぶようにする。

【００９８】つぎに、エッジ／非エッジを判定するに
は、所定のブロック内において、パターンマッチングで
検出した高濃度レベルの画素および低濃度レベルの画素
が、両者とも所定の個数以上、存在する場合、注目のブ
ロックをエッジ領域とし、それ以外は非エッジ領域と判
定する。

【００９９】網点像領域の検出はつぎのようにして行
う。網点画像は絵を点で表現したものであるから、その
濃度分布はあたかも剣山の如く、円錐状の山（谷）が数
多くしかも、均一に存在している。この特性を利用して
網点とその他を分類する。すなわち、局所領域におい
て、網点の頂上と谷底にあたる画素（つまり、ピーク画
素）の密度が高く、それが均一に存在する部分を網点像
領域とする。

【０１００】ピーク画素の検出の具体的な手法はつぎの
通りである。例えば、画像を３×３画素のブロックに分
け、このブロックにおいて中心画素の濃度レベルＬが周
囲の全ての画素の濃度レベルより高い、あるいは低く、
かつ、Ｌと中心画素を挟んで対角線上に存在する対の画
素ａ，ｂの濃度レベルが、４対とも｜２×Ｌ−ａ−ｂ｜＞ＴＨ（但し、ＴＨは固定の閾値）なる条件を満たす場合、中
心画素をピーク画素とする。これでピーク画素の検出が
できる。

【０１０１】つぎに網点像領域の検出はつぎのようにし
て行う。所定のブロック内においてピーク画素が存在す
れば、注目のブロックを網点候補領域とし、それ以外は
非網点候補領域と判定する。つぎに、この網点像領域の
結果を利用して補正を行う。これは、注目ブロックが非
網点候補領域と判定されたものであってもその周囲のブ
ロックの多くが網点候補領域であれば、網点像領域内の
ものである可能性が大きいからであり、この場合は前記
注目ブロックを網点像領域とする補正である。

【０１０２】逆に、注目ブロックが網点候補領域のもの
であると判定されたものであっても、その注目ブロック
の周囲のブロックの多くが非網点候補であると判定され
ていれば、網点像領域のブロックでない可能性が非常に
高いことになるため、この注目ブロックを非網点候補に
変更する補正をする。

【０１０３】つまり、入力画像について所定画素ブロッ
ク単位に分け、各ブロックについてピーク画素検出を行
い、これよりそのブロックが網点候補／非網点候補のい
ずれであるか判別を行い、この判別結果について隣接ブ
ロックの状態から網点候補／非網点候補の変更補正を施
してからそのブロックについて網点／非網点の判定を行
うことで網点領域検出をすることが出来る。

【０１０４】このようにして網点領域検出とエッジ領域
検出を行ったならば、つぎにこれらの結果を用いた総合
判定をする。この総合判定は、エッジ領域検出処理結果
と網点領域検出処理結果を用いての文字像領域／網点像
領域／写真像領域の判定である。

【０１０５】すなわち、エッジ領域検出で、エッジ領域
と判定され、かつ、網点領域検出で非網点領域と判定さ
れた領域は文字像領域とし、その他の領域を絵柄像領域
（網点像領域／写真像領域）とする。そして、絵柄像領
域である場合には、網点候補と判定されているとき、エ
ッジ／非エッジの判定にかかわりなく網点像領域の画像
であると判断し、エッジ／非エッジの判定結果がエッジ
であった場合には網点候補であるなしにかかわりなく写
真像領域の画像であると判断する。

【０１０６】以上の処理で領域分離装置２Ａは、入力画
像信号を文字像領域と写真像領域と網点像領域に分割し
て出力することが出来る構成となる。本システムでは領
域分離装置２Ａは、文字像領域と判定した信号について
は濃度レベル別領域分類装置３に与え、写真像領域と判
定した信号については写真画像出力装置６を介して写真
画像用符号化装置１２に与え、網点像領域と判定した信
号については網点画像出力装置７を介して網点画像用符
号化装置１９に与える構成としてある。

【０１０７】ここで網点画像出力装置７は領域分離装置
２Ａから与えられた網点像領域の信号を一時保持して網
点画像用符号化装置１９に与える装置であり、網点画像
用符号化装置１９はこの網点画像出力装置７を介して与
えられた網点像領域の画像信号を符号化する装置であ
り、網点像領域の画像信号をＪＰＥＧと同様の方式で符
号化するものである。ただし、直交変換、例えば、ＤＣ
Ｔ変換後のＤＣＴ係数のうち、網点そのものを表現して
いる周波数成分の項（これをｋとする）以上の高い周波
数成分の項（ｋ以上の高い周波数成分の項ｋ＋１，ｋ＋
２，…）の値を“０”なるデータ値に置き換えてからＪ
ＰＥＧ方式と同様に符号化を行う。つまり、網点そのも
のを現している空間周波数成分を越える高周波数成分は
カットする。

【０１０８】記憶装置１３には、上記文字画像用符号化
装置１１、写真画像用符号化装置１２、網点画像用符号
化装置１９が符号化して出力する各符号化画像信号を記
憶するようにするが、各符号化画像信号を１枚の画像中
におけるそれぞれの位置や種別等がわかるように記憶す
る。

【０１０９】このような構成において、写真、網点画
像、文字の混在する原稿をイメージスキャナ１で読み取
らせる。イメージスキャナ１はこの原稿をライン単位で
順次スキャンしながら読取り、この読み取った画像を順
次例えば２５６階調のモノクロームの画像信号（あるい
はカラー画像信号でも可）に変換して出力する。

【０１１０】イメージスキャナ１から出力された多階調
の画像信号は、領域分離装置２Ａに入力され、領域分離
装置２Ａではこの画像信号について文字像領域相当部分
と写真像領域相当部分および網点像領域相当部分に分離
する。すなわち、この分離によって、原稿の画像信号は
写真像領域部分のみの画像信号、網点像領域部分のみの
画像信号、文字像領域部分のみの画像信号に分けられ
る。

【０１１１】このときの領域の判別にはモノクロームの
画像信号の場合は輝度レベルを用いて、また、原色系カ
ラー信号の場合はＲＧＢの画像信号のうち、Ｇ成分の信
号を用いる。これはＧ成分の信号が輝度信号の代わりに
使用できるからである。

【０１１２】そして、Ｇ成分あるいは輝度レベルを利用
して画像中の文字像領域の判別には、エッジ領域検出の
手法により、網点像領域の判別には網点画像の特質を利
用した濃度レベルのピーク画素検出方法によりその判別
結果を元にして行う。そして、文字像領域でもなく、網
点像領域でもない残りの領域を写真画像として判別す
る。

【０１１３】このようにして領域分離装置２Ａでは画像
信号について文字像領域相当部分と写真像領域相当部分
および網点像領域相当部分に分離し、文字像領域相当部
分の画像信号は濃度レベル別領域分類装置３に、写真像
領域相当部分の画像信号は写真画像出力装置６に、網点
像領域相当部分の画像信号は網点画像出力装置７に出力
する。

【０１１４】そして、網点像領域相当部分の画像信号に
ついては濃度レベル別領域分類装置３により上述の実施
例１，実施例２と同様に１画面分の文字像領域の信号に
ついて全体を一定間隔でサンプリングすることにより、
文字画像中の同じ濃度レベルの画素が占める領域を分離
する。そして、濃度レベル別に分類された文字像領域の
画像信号は、文字領域信号変換装置４において二値化さ
れる。ここでは分類された濃度レベル（背景色）を上述
同様に例えば、基準値“０”、文字の濃度レベルを
“１”として二値化する。そして、元の濃度レベルの値
と共に、この二値化したものを二値画像データ出力装置
５に出力する。二値画像データ出力装置５ではこの二値
化して与えられたデータの最初の２バイトに、背景の濃
度レベル値と文字の濃度レベル値を付加した図３に示す
如きフォーマットでデータを文字画像用符号化装置１１
に出力する。そして、文字画像用符号化装置１１ではこ
のデータをランレングス符号化処理する。

【０１１５】一方、領域分離装置２によって分離された
写真像領域の画像信号は、写真画像出力装置６に送ら
れ、ここで一旦バッファリングされた後、写真画像用符
号化装置１２に送られ、ここでＪＰＥＧ方式により符号
化される。

【０１１６】また、領域分離装置２は写真像領域につい
ては画素毎の濃度レベル対応の値にした多値の画像デー
タとして出力する。この結果、文字像領域の画像につい
て、その背景相当の領域の濃度レベルのほぼ等しいもの
単位で領域が分割され、その分割されたものについてそ
れぞれ背景濃度レベルと文字濃度レベルの値を先頭に、
これら背景と文字を二値化した画像データに変換したも
のが輪郭画像に適した符号化形式で符号化され、写真像
領域については画素毎の濃度レベル対応の値にした多値
の画像データとして出力されたものが写真等に適した符
号化形式で符号化されることになる。

【０１１７】また、領域分離装置２Ａによって分離され
た網点像領域の画像信号は、網点画像出力装置７により
一旦バッファリングされ、網点画像用符号化装置１９に
送られ、ここでＪＰＥＧ方式により符号化される。ただ
し、直交変換、例えば、ＤＣＴ変換後のＤＣＴ係数のう
ち、網点そのものを表現している周波数成分の項（これ
をｋとする）より高い周波数成分の項（ｋ以上の高い周
波数成分の項ｋ＋１，ｋ＋２，…）の値を“０”なるデ
ータ値に置き換えてからＪＰＥＧ方式と同様に符号化を
行う。つまり、網点そのものを現している空間周波数成
分以上の高周波数成分はカットする。この結果、網点像
領域の画像信号は画質に余り影響のない空間周波数の高
い周波数成分をカットした高圧縮率の符号化がなされた
データとなる。

【０１１８】記憶装置１３には、上記文字画像用符号化
装置１１、写真画像用符号化装置１２、網点画像用符号
化装置１９が符号化して出力する各符号化画像信号が記
憶される。

【０１１９】画像の復元は、記憶装置１３より保存され
ている符号化データをそれぞれ読み出して復号化処理を
行う。絵柄像領域の符号化データつまり、写真や網点画
像の領域の符号化データはＪＰＥＧにより符号化されて
いるデータであるから、ＪＰＥＧ復号化器である多階調
画像復号化装置１４によりＪＰＥＧ復号化を行い、文字
像領域の符号化データはランレングス符号化されたデー
タであるから、ランレングス復号化器である文字領域復
号化装置１５でランレングス復号化処理を行う。

【０１２０】文字領域復号化装置１５では復号したデー
タについて、さらに濃度レベル値部分の情報を参照して
元の階調の濃度データに戻す。このようにして、復号化
された画像を画像データ合成装置１７で１枚の画像に合
成した後に、表示装置１８で画像データを表示する。

【０１２１】以上のように、実施例３によれば、文字や
写真、網点画像等のような性質の異なる複数の像領域が
一枚の画像に混在する画像を圧縮する場合、像を文字像
領域と写真像領域と網点像領域に分離し、分離した像そ
れぞれについて画像の特性に合わせて符号化すること
で、単純に一種類の圧縮方法を用いた場合に比べ、圧縮
率を大幅に改善することができるようになるばかりでな
く、中間調の背景中に文字があるような場合でも、この
ような文字像領域の画像については、背景の濃度レベル
別に領域を分割してこの分割した領域のデータについて
二値化しており、しかも、背景濃度レベル値（その領域
での背景濃度レベル値の代表値）と文字濃度レベル値
（その領域での文字濃度レベル値の代表値）をその領域
のデータの先頭に付加して送るようにしているので、再
生時には復号化したデータについてこの背景濃度レベル
値と文字濃度レベル値を使用して二値データを多値デー
タに復元した後、各領域の復元データと写真像領域の復
号化データとを合成して元の一枚の画像に復元すること
で、中間値濃度の背景等を含む文字画像は文字画像とし
てその背景濃度を損なうことなく輪郭のはっきりした像
として再現できるようになり、従って、文字像領域が中
間値濃度の背景を含む場合でも、再現性のよい画像を得
ることのできる画像符号化・復号化処理を行うことがで
きるシステムが提供できるようになる。

【０１２２】以上、種々の実施例を説明したが、上述の
実施例に限定されるものではなく、種々変形して実施す
ることができる。なお、本実施例にはつぎの実施態様も
含まれる。

【０１２３】［１］１画面に文字像と写真像等の絵柄
像とが混在した文書・写真混在多階調画像信号を複数の
領域に分割する装置であって、入力画像信号を（画像の
エッジ検出とそのエッジの連続性に基づいて）絵柄像領
域と文字像領域に分離する画像領域分離装置と、この分
離された文字像領域内の画像信号をほぼ同一濃度レベル
の領域毎に分ける分類装置と、この分類装置により分け
られたほぼ同一濃度レベルの領域毎にその画像信号につ
いてその濃度レベルに応じて二値化すると共に、この二
値化したデータを二値化時の代表的な濃度レベル情報と
ともに出力する変換装置とより構成するもの。

【０１２４】このような構成によれば、画像領域分離装
置により、入力画像信号を絵柄像領域と文字像領域に分
離すると共に、この分離された文字像領域内の画像信号
を分類装置によりほぼ同一濃度レベルの領域毎に分け、
変換装置では、この分けられたほぼ同一濃度レベルの領
域毎にその画像信号についてその濃度レベルに応じて二
値化すると共に、この二値化したデータを二値化時の代
表的な濃度レベル情報とともに出力することができる。

【０１２５】従って、画像信号内に文字や写真等のよう
な性質の異なる複数の領域が混在する場合に、画像の圧
縮のための符号化処理を行う前に特性に合わせて画像を
領域分割することで、分割した領域毎に最適な符号化処
理を施すことができるようになる。また、中間調で表現
された文字像領域の画像のデータを中間調を失うことな
く二値化することが可能となる。

【０１２６】画像信号内に文字や写真等のような性質の
異なる複数の領域が混在する場合に、画像の圧縮のため
の符号化処理を行う前に文字像領域部分や絵柄像（写真
等）領域部分などの像の特性に合わせて画像を領域分割
することで、後段では写真像領域については多値の画像
データをＪＰＥＧなどのような直交変換（ＤＣＴ変換）
処理，ハフマン符号化処理を施して圧縮符号化する写真
画像に適用して最適な符号化処理手法で圧縮処理するこ
とができ、文字像領域については輪郭画像について輪郭
のボケを生じることなく高い効率で圧縮符号化できるラ
ンレングス符号化による圧縮符号化を施すことができる
ようになる。

【０１２７】しかも、文字像領域の画像については、背
景の濃度レベル別に分割してこれを二値化しており、背
景濃度レベル値と文字濃度レベル値をその領域のデータ
の先頭に付加して出力するようにしたので、文字像領域
についてその背景色の状態が異なるものであっても、そ
れが再現できるようにして二値化できており、従って、
中間調で表現された文字像領域の画像のデータを中間調
を失うことなく二値化することが可能となる。そして、
これを符号化して圧縮したものを、復号化するに際して
は、復号化したデータについてこの背景濃度レベル値と
文字濃度レベル値を使用して二値データを多値データに
復元した後、各領域の復元データと写真像領域の復号化
データとを合成して元の一枚の画像に復元することで、
中間値濃度の背景等を含む文字画像は文字画像としてそ
の背景濃度を損なうことなく輪郭のはっきりした像とし
て再現できるようになり、文字像領域が中間値濃度の背
景を含む場合でも、再現性のよい画像を得ることのでき
る画像領域別のデータ化処理を行うことができるように
なる。

【０１２８】なお、本構成は、画像データベース装置な
どに適用し、高画質と高い圧縮率を両立させるための前
処理を行うに最適であり、種々の用途に応用できる。［２］上記［１］項の装置であって、画像領域分離装
置において入力画像信号の隣合う画素間の色空間上の距
離を求めることにより、文字像領域と絵柄像領域に分離
することを特徴とするもの。

【０１２９】文字像は輪郭がはっきりしており、一方、
写真や網点像等の絵柄像は隣合う画素間での濃度変化が
緩い場合が多く、従って、隣合う画素間の色空間上の距
離の大小を元にその輪郭の境界と長さを調べることで、
容易に文字像領域と絵柄像領域に分離することができる
ようになる。

【０１３０】［３］上記［１］項の装置であって、画
像領域分離手段において入力画像信号がモノクローム多
階調の信号であった場合、隣合う画素間の濃度レベルの
大きさを求めることにより、文字像領域と絵柄像領域に
分離することを特徴とする。

【０１３１】文字像は輪郭がはっきりしており、一方、
写真や網点像等の絵柄像は隣合う画素間での濃度変化が
緩い場合が多く、従って、隣合う画素間の濃度レベルの
大小を元にその輪郭の境界と長さを調べることで、容易
に文字像領域と絵柄像領域に分離することができるよう
になる。

【０１３２】［４］上記［１］項の装置であって、画
像分類装置において文字像領域中の同一濃度レベルを分
類するために、文字像領域の全画像領域について一定の
距離間隔でサンプリングする。

【０１３３】文字像領域の全画像領域について一定の間
隔でサンプリングすることにより、文字像領域全体の濃
度レベル分布が分かり、ほぼ同一の濃度レベル域毎に分
ける処理が行える。そして、サンプリングは一定の距離
間隔で行うことから、全体のサンプリング数は少なくて
済むから、処理時間を短縮することができるようにな
る。

【０１３４】

【発明の効果】以上、詳述したように、本発明によれ
ば、画像信号内に文字や写真等のような性質の異なる複
数の領域が混在する場合に、画像の圧縮のための符号化
処理を行う前に特性に合わせて画像を領域分割すること
で、分割した領域毎に最適な符号化処理を施すことがで
きるようになる他、中間調で表現された文字像領域が存
在する場合にも、その文字画像のデータを中間調を失う
ことなく二値化することが可能となるなど、符号化効率
の高い、しかも、画質の劣化の少ない画像圧縮符号化・
復号化が可能なデータ処理装置を提供できる。

【図面の簡単な説明】

【図１】本発明の実施例を説明するための図であって、
本発明の実施例１の全体構成を示すブロック図。

【図２】本発明の実施例を説明するための図であって、
本発明の実施例１の作用を説明するための図。

【図３】本発明の実施例を説明するための図であって、
本発明の実施例１の作用を説明するための図。

【図４】本発明の実施例を説明するための図であって、
本発明の実施例２の全体構成を示すブロック図。

【図５】本発明の実施例を説明するための図であって、
本発明の実施例３の全体構成を示すブロック図。

【符号の説明】

１…イメージスキャナ、２，２Ａ…領域分離装置、３…
濃度レベル別領域分類処理装置、４…文字領域信号変換
装置、５…二値画像データ出力装置、６…写真画像の出
力装置、１１…文字画像用符号化装置、１２…写真画像
用符号化装置、１３…記憶装置、１４…多階調画像復号
化装置、１５…文字領域復号化装置、１６…画像変換装
置、１７…画像合成装置、１８…表示装置、１９…網点
画像用符号化装置。

Claims

【特許請求の範囲】

【請求項１】１画面に文書と絵柄像が混在した文書・
写真混在多階調画像信号を複数の領域に分割するデータ
処理装置において、入力画像信号を絵柄像領域と文字像領域に分離する画像
領域分離手段と、この分離された文字像領域内の画像信号をほぼ同一濃度
レベルの領域毎に分ける分類手段と、この分類手段により分けられたほぼ同一濃度レベルの領
域毎にその画像信号についてその濃度レベルに応じて二
値化すると共に、この二値化したデータを二値化時の代
表的な濃度レベル情報とともに出力する変換手段と、を
具備したことを特徴とする文書・写真混在多階調画像の
データ処理装置。
【請求項２】１画面に文書と絵柄像が混在した文書・
写真混在多階調画像信号を符号化・復号化処理するデー
タ処理装置において、入力画像信号を絵柄像領域と文字像領域に分離する画像
領域分離手段と、絵柄像領域の画像信号を符号化する絵柄画像符号化手段
と、前記画像領域分離手段により分離された文字像領域内の
画像信号をほぼ同一濃度レベルの領域毎に分ける分類手
段と、この分類手段により分けられたほぼ同一濃度レベルの領
域毎にその画像信号についてその濃度レベルに応じて二
値化すると共に、この二値化したデータを二値化時の代
表的な濃度レベル情報とともに出力する変換手段と、この変換手段からの出力を符号化する文字像用符号化手
段と、よりなる符号化処理系と、前記文字像用符号化手段により符号化された文字像領域
内の画像信号を復号化すると共に、二値化時の代表的な
濃度レベル情報を用いて元の濃度レベルの画像信号に復
元する復元処理手段と、前記絵柄画像符号化手段により符号化された画像信号を
復号化する復号化手段と、この復号化手段により復号化された画像信号と前記復元
処理手段により復元された画像信号を合成して元の１画
面の画像信号にして出力する合成手段と、よりなる復号
化処理系と、を具備することを特徴とする文書・写真混
在多階調画像のデータ処理装置。
【請求項３】画像分類手段は、文字像領域中のほぼ同
一濃度レベルの領域を分けるために、文字像領域を一定
間隔でサンプリングし、そのサンプリング値がほぼ同一
濃度レベルの範囲をもって領域分けする構成とすること
を特徴とする請求項１または２いずれか１項記載の文書
・写真混在多階調画像のデータ処理装置。