JP2017175213A - 原稿種認識装置、画像形成装置、原稿種認識方法およびプログラム - Google Patents

原稿種認識装置、画像形成装置、原稿種認識方法およびプログラム Download PDF

Info

Publication number
JP2017175213A
JP2017175213A JP2016055991A JP2016055991A JP2017175213A JP 2017175213 A JP2017175213 A JP 2017175213A JP 2016055991 A JP2016055991 A JP 2016055991A JP 2016055991 A JP2016055991 A JP 2016055991A JP 2017175213 A JP2017175213 A JP 2017175213A
Authority
JP
Japan
Prior art keywords
image
document type
unit
document
histogram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016055991A
Other languages
English (en)
Other versions
JP6648580B2 (ja
Inventor
大内 敏
Satoshi Ouchi
敏 大内
卓治 鎌田
Takuji Kamata
卓治 鎌田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2016055991A priority Critical patent/JP6648580B2/ja
Priority to US15/457,143 priority patent/US10115011B2/en
Publication of JP2017175213A publication Critical patent/JP2017175213A/ja
Application granted granted Critical
Publication of JP6648580B2 publication Critical patent/JP6648580B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • H04N1/58Edge or detail enhancement; Noise or error suppression, e.g. colour misregistration correction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/168Smoothing or thinning of the pattern; Skeletonisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40062Discrimination between different image types, e.g. two-tone, continuous tone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/407Control or modification of tonal gradation or of extreme levels, e.g. background level
    • H04N1/4072Control or modification of tonal gradation or of extreme levels, e.g. background level dependent on the contents of the original
    • H04N1/4074Control or modification of tonal gradation or of extreme levels, e.g. background level dependent on the contents of the original using histograms
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/409Edge or detail enhancement; Noise or error suppression
    • H04N1/4092Edge or detail enhancement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0094Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Artificial Intelligence (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Processing (AREA)

Abstract

【課題】原稿の属性(例えば、文字のみ原稿/新聞原稿/薄い原稿/その他の原稿)を同じ判定方式を用いた簡単な構成で分類する。
【解決手段】入力画像の文字領域と絵柄領域とを分離した各領域を示す信号を出力する像域分離部21と、前記入力画像の前記絵柄領域における特定の線数以上の網点ドットを除去する平滑化処理を施す平滑化部と、前記平滑化処理を施した前記入力画像における前記文字領域のエッジ部に対してエッジ量に応じたエッジ強調処理を施した画像を出力するエッジ強調部と、前記エッジ強調処理を施した画像にかかるヒストグラムを作成するヒストグラム作成部と、前記ヒストグラムを利用して前記入力画像にかかる原稿種を認識する原稿種認識部51と、を備える。
【選択図】図1

Description

本発明は、原稿種認識装置、画像形成装置、原稿種認識方法およびプログラムに関する。
従来、PDFの圧縮率を高め、さらに高画質化を行う技術として、高圧縮PDFが知られている。高圧縮PDFは、画像を文字領域と絵柄領域に像域分離し、文字領域と絵柄領域とのそれぞれに適した圧縮処理(MMRやJPEGなど)を施すことで、高圧縮を実現する技術が知られている。
また、原稿全体の属性を判定する技術を一般的に原稿種認識技術と言う。高圧縮PDF作成時において、原稿種認識技術により原稿種を判定することによって、原稿種に適した処理の切り替え(例えば、二値化処理の閾値、適切な圧縮方法を選択など)を行うことも知られている。
ところで、高圧縮PDF作成時において、原稿種認識技術により判定した原稿種に適した処理の切り替えを行うことにより高画質化が期待される原稿の種類としては、次のような原稿種が存在する。
・文字のみ原稿
・新聞原稿
・薄い原稿
特に、昨今の環境意識の高まりから、複写機で画像を再生する際、トナーセーブモードで複写出力するケースが増えている。このようにトナーセーブモードでの出力画像を原稿としてスキャンし高圧縮PDF作成を行う際には、原稿は当然「薄い原稿」となる。
しかしながら、従来の原稿種認識技術によれば、原稿種ごとに判定回路が必要になり、処理コストが大きいという問題があった。さらに、従来の原稿種認識技術および圧縮技術によれば、「文字のみ原稿」と「新聞原稿」とには対応しているが、その他の原稿種(例えば、「薄い原稿」)には対応していないという問題があった。
本発明は、上記に鑑みてなされたものであって、原稿の属性(例えば、文字のみ原稿/新聞原稿/薄い原稿/その他の原稿)を同じ判定方式を用いた簡単な構成で分類することを目的とする。
上述した課題を解決し、目的を達成するために、本発明は、入力画像の文字領域と絵柄領域とを分離した各領域を示す信号を出力する像域分離部と、前記入力画像の前記絵柄領域における特定の線数以上の網点ドットを除去する平滑化処理を施す平滑化部と、前記平滑化処理を施した前記入力画像における前記文字領域のエッジ部に対してエッジ量に応じたエッジ強調処理を施した画像を出力するエッジ強調部と、前記エッジ強調処理を施した画像にかかるヒストグラムを作成するヒストグラム作成部と、前記ヒストグラムを利用して前記入力画像にかかる原稿種を認識する原稿種認識部と、を備える。
本発明によれば、入力画像の原稿種認識について注目画素の画素値を複数の閾値で量子化して作成したヒストグラムを利用して行うが、その前処理として絵柄領域における特定の線数以上の網点ドットを除去する平滑化処理と文字領域のエッジ部に対してエッジ量に応じたエッジ強調処理を施すようにしたので、例えば下記の4種類の原稿種を同じ判定方式を用いた簡単な構成で分類することができる、という効果を奏する。
・文字のみ原稿
・新聞原稿
・薄い原稿
・その他の原稿
図1は、第1の実施の形態にかかる画像形成装置の構成を示すブロック図である。 図2は、像域分離部の構成を示すブロック図である。 図3は、M×M画素からなるマトリックスの画素比較方向を示す図である。 図4は、N×N画素からなるブロックの例を示す図である。 図5は、注目ブロックと周囲ブロックの関係を示す図である。 図6は、フィルタ処理部の構成を示すブロック図である。 図7は、適応エッジ強調回路の構成を示すブロック図である。 図8は、ラプラシアンを例示的に示す模式図である。 図9は、エッジ量フィルタを例示的に示す模式図である。 図10は、原稿種認識部における原稿種認識処理の流れを概略的に示すフローチャートである。 図11は、ヒストグラムを作成する際に用いる原稿上の判定領域を示す模式図である。 図12は、ヒストグラム作成例を示す図である。 図13は、高圧縮PDFの処理手順を説明する模式図である。 図14は、画像圧縮部における画像圧縮処理の流れの一例を示すフローチャートである。 図15は、各原稿種のγ補正テーブルの一例を示す図である。 図16は、原稿種に応じて変換される各レイヤの解像度を示す図である。 図17は、第2の実施の形態にかかる像域分離部の構成を示すブロック図である。 図18は、網点検出回路の構成を示すブロック図である。 図19は、原稿種認識部における原稿種認識処理の流れを概略的に示すフローチャートである。 図20は、原稿種認識部により判定される「薄い原稿」のパターン例を示す図である。 図21は、薄い原稿種の各パターンのγ補正テーブルの一例を示す図である。 図22は、薄い原稿種の各パターンに応じて変換される各レイヤの解像度を示す図である。 図23は、画像形成装置のハードウェア構成例を示すブロック図である。
以下に添付図面を参照して、原稿種認識装置、画像形成装置、原稿種認識方法およびプログラムの実施の形態を詳細に説明する。本実施の形態は、原稿種認識装置としてデジタル式のカラー画像形成装置であって、コピー機能、プリンタ機能、スキャナ機能およびファクシミリ機能のうち少なくとも2つの機能を有する複合機を例にとって説明する。
(第1の実施の形態)
図1は、第1の実施の形態にかかる画像形成装置100の構成を示すブロック図である。初めに、図1を利用して、画像形成装置100を構成する各ユニットのイン信号とアウト信号を中心に説明し、各ユニットの内部詳細は必要に応じて後述する。
図1に示すように、画像形成装置100は、スキャナ1と、画像処理装置2と、HDD(Hard Disk Drive)3と、プロッタ4と、高圧縮PDFファイル(高圧縮画像ファイル)を生成する画像圧縮処理装置5と、を備えている。
スキャナ1は、原稿から画像データを読み取る装置である。スキャナ1は、読み取った画像データ(A/D変換後のr,g,bの各8ビット信号:反射率リニア)を、画像処理装置2へ送る。
画像処理装置2は、像域分離部21と、フィルタ処理部22と、データインタフェース部23と、色処理/UCR部24と、プリンタ補正部25と、を備える。
像域分離部21は、スキャナ1が読み取った画像データ(r,g,b)を用いて、文字領域と絵柄領域の分離を行う。像域分離部21から出力されるX信号は、2ビット信号(文字/非文字領域信号、色/非色領域信号)である。X信号は、フィルタ処理部22およびデータインタフェース部23を経由して、HDD3に出力されて保存される。
フィルタ処理部22は、スキャナ1が読み取った画像データ(r,g,b)に空間フィルタを施す。フィルタ処理部22で空間フィルタを施された出力(RGB信号、z信号)は、データインタフェース部23を経由して、HDD3に出力されて保存される。なお、z信号は、詳細は後述するが、エッジ領域を表す信号である。
加えて、空間フィルタを施されたRGB信号は、データインタフェース部23を経由して、色処理/UCR部24に送られる。色処理/UCR部24は、各8ビットのRGB信号を所定の変換式に基づきプロッタ4の制御信号である画像信号(C,M,Y,Bkの各8ビット)に変換して、プリンタ補正部25へ送る。
プリンタ補正部25は、C,M,Y,Bkの画像信号に対してプロッタ4の階調特性を反映したγ補正処理及び擬似中間調処理を施して、プロッタ4に出力する。
そして、転写印字ユニットであるプロッタ4は、画像処理装置2から出力された画像信号を転写印字する。
次に、画像処理装置2の像域分離部21について説明する。ここで、図2は像域分離部21の構成を示すブロック図である。図2に示すように、像域分離部21は、スキャナ1が読み取ったデータ(A/D変換後のr,g,b:各色8ビット:反射率リニア)に対して、色毎の諧調バランスを揃えるための一次元変換処理(γ補正処理)を施す。
また、像域分離部21は、文字判定部211と、色判定部212と、を備えている。γ補正後の濃度リニア信号(RGB信号:白を意味する信号値を0とする)は、文字判定部211と色判定部212へそれぞれ送られる。
文字判定部211は、エッジ検出回路2111と、白背景検出回路2112と、網点検出回路2113と、総合判定回路2114と、を備えている。
エッジ検出回路2111は、γ補正後の濃度リニア信号(G)に対してエッジ判定(白画素と黒画素の連続性により判定)を行って線画候補のエッジを検出する処理を行い、その結果(以下、「エッジ検出結果」と呼ぶ)を総合判定回路2114に出力する。エッジ検出回路2111は、例えば、入力画像信号の3値化により得られる黒画素や白画素の連続性、パターンを利用して、文字などの線画と網点とを分離することで、線画候補を構成するエッジを検出する。エッジ検出回路2111の出力は1画素1ビットであり、検出されたエッジ領域画素をアクティブとする。
白背景検出回路2112は、γ補正後の濃度リニア信号(G)について、白背景か非白背景かを判定し、その結果を総合判定回路2114に出力する。白背景検出回路2112は、例えば、入力画像信号を所定の閾値で2値化して白画素と黒画素に切り分けた後、注目画素の左右あるいは上下両方向に白画素が存在する場合に、白背景と判定する。このとき、左右上下の参照領域のサイズを制御することにより、所望の線幅以下の文字エッジ部は白背景として判定し、所望の線幅を超える文字エッジ部は非白背景として判定することができる。白背景検出回路2112の出力は、白背景をアクティブとする。
網点検出回路2113は、γ補正後の濃度リニア信号(G)の各画素に対して、網点判定(画像中の山/谷ピーク画素の繰り返しパターンにより判定)し、その結果を総合判定回路2114に出力する。
より詳細には、網点検出回路2113は、γ補正後の濃度リニア信号(G)の各画素に対して、予め定めたM×M画素からなるマトリックス、例えば、図3(a)〜(c)に示す如き3×3画素サイズのマトリックス(M=3)、4×4画素サイズのマトリックス(M=4)あるいは5×5画素サイズのマトリックス(M=5)を順次適用し、当該マトリックスの中心画素m(図3(a)〜(c)参照)が濃度変化の山または谷を示す極点であるか否かを周囲の画素m〜mとの濃度関係から検出する。加えて、網点検出回路2113は、N×N画素(但し、N>M)からなるブロックB、例えば図4に示すような9×9画素サイズ(N=9)からなるブロックBを単位として画像を分割する。
そして、網点検出回路2113は、ブロックごとに山を示す極点画素数と谷を示す極点画素数とをそれぞれ計数し、計数値の大きい側の極点画素数を当該ブロックの極点画素数として決定する。その後、網点検出回路2113は、図5に示す注目ブロックBの極点画素数Pと、これを囲む上下左右斜めの各周囲ブロックB〜Bの各極点画素数Pとの関係から当該注目ブロックBの中心画素n(図4参照)、あるいは当該注目ブロックB内の全ての画素n〜n80が網点領域に属するか否かを判定する。網点検出回路2113の出力は、網点領域をアクティブとする。
総合判定回路2114は、注目画素がエッジ検出回路2111でアクティブ、白背景検出回路2112でアクティブ、網点検出回路2113でノンアクティブの場合に、注目画素を文字領域とする判定結果Xmoji(文字/非文字[絵柄])をX信号として出力する。
色判定部212は、色判定回路2121を備えている。色判定回路2121は、γ補正後の濃度リニア信号(R,G,B)について、注目の画素ブロック(4×4画素)が、有彩色ブロックであるか、無彩色ブロックであるかを判定する。
より詳細には、色判定回路2121は、例えば、Max(|R−G|,|G−B|,|B−R|)>th(thは所定の閾値)に該当する画素を有彩画素として検出し、4×4画素からなるブロック毎に有彩画素が1つでも存在すればアクティブブロックとする判定結果Xiro(有彩色/無彩色)をX信号として出力する。
次に、画像処理装置2のフィルタ処理部22について説明する。ここで、図6はフィルタ処理部22の構成を示すブロック図である。図6に示すように、フィルタ処理部22は、平滑化部である平滑化回路221と、γテーブル変換回路222と、エッジ強調部である適応エッジ強調回路223と、を備えている。フィルタ処理部22は、画像の絵柄領域に対して、特に網点を意識して平滑化処理を施す。その一方で、フィルタ処理部22は、画像のエッジ部に対して、特に文字エッジを意識してエッジ強調処理を施す。
平滑化回路221は、スキャナ1が読み取った画像データ(r,g,b:反射率リニア)に対し、ある特定の線数以上の網点ドットを除去するような空間フィルタ処理を施す。より詳細には、平滑化回路221は、スキャナ1が読み取った画像データに平滑化を施す。この平滑化フィルタは、カットオフ周波数100線付近で、100線(3.9lps/mm)を超える網点の周波数をほぼ除去し、それ以下の周波数はほぼ完全に残すような特性を有するフィルタである。これにより、網点原稿のモアレ発生を防ぎ、さらに写真原稿のノイズ低減が可能となる。
γテーブル変換回路222は、反射率リニアの信号を濃度リニアに変換する一次元変換処理(γ補正処理)を行う。
適応エッジ強調回路223は、画像全体にエッジ強調をかけるのではなく、画像のエッジ部のみを立てるようなエッジ強調処理を施す。画像全体にエッジ強調をかけないのは、平滑化回路221で除去した網点ドットが復活してしまうためである。
フィルタ処理部22は、平滑化処理とエッジ強調処理とで信号の属性を変えることにより、網点ドットを効率良く除去しつつ、文字領域を細くすっきりと再生させることができる。
ここで、図7は適応エッジ強調回路223の構成を示すブロック図である。図7に示すように、適応エッジ強調回路223は、濃度リニアの平滑化画像信号について、ラプラシアン(エッジ強調フィルタ)2231によりエッジを抽出する。図8は、ラプラシアン2231を例示的に示す模式図である。ラプラシアン2231は、注目画素を4倍し、4隣接画素との差分をとってエッジを抽出する。このように、濃度リニアの信号に基づいてエッジ抽出を行うことは、網点上の文字および色地上の文字を細く、鮮明に再生するために有効である。
ラプラシアン2231は、エッジとして検出された領域について、空間周波数上の全域にわたってpowerを持つような特性のフィルタを掛けることにより、高画質な網点上の文字画像を得る。
また、適応エッジ強調回路223は、スキャナ1が読み取った入力画像信号(r,g,b:反射率リニア)について、エッジ量フィルタ2232によりエッジ量を算出する。図9は、エッジ量フィルタ2232を例示的に示す模式図である。図9に示すエッジ量フィルタ2232は、注目画素とその周辺画素に一次微分フィルタをかける例である。すなわち、入力画像データIのx方向の一次微分の絶対値、y方向の一次微分の絶対値をとり、その最大をエッジ量とするもので、fは最大値1に規格化する関数である。
なお、エッジ量フィルタ2232とラプラシアン2231の空間周波数上での相違は、高域において、エッジ量フィルタ2232のpowerはラプラシアン2231のpowerよりも小さいことである。これは、網点上の文字において、網点はできるだけエッジとして検出せずに、網点上文字エッジのエッジ量を大きくするためである。従って、網点は平滑化され、なお且つ高域でのエッジ量はほとんど0になる。
適応エッジ強調回路223は、ラプラシアン2231の出力とエッジ量フィルタ2232の出力を乗算するとともに、注目画素と乗算された値とを加算器で加算して、注目画素をエッジ強調する。
また、適応エッジ強調回路223は、エッジ量フィルタ2232の出力値を適当な閾値で二値化し、エッジ領域を表す信号(z)を、後段の原稿種認識部51でヒストグラムを生成する際に利用するため、RGB信号やX信号と共にデータインタフェース部23に送る。
以上により、適応エッジ強調回路223は、網点上の文字や色地上の文字にコントラストをつけ、さらに絵柄(網点、写真)中のエッジを強調して、めりはりのある画像を得るための処理を施す。反対に、適応エッジ強調回路223は、それ以外の網点領域に対しては、エッジ強調を行わず、ざらつきなく、滑らかな画像再生を可能にする。
すなわち、フィルタ処理部22は、網点を平滑化し、網点をエッジとして検出しないのでエッジ強調せず、また、文字の周りの網点を平滑化して文字エッジを強調するので、めりはりのある画像を得ることができる。
続いて、画像圧縮処理装置5について説明する。図1に示すように、画像圧縮処理装置5は、原稿種認識部51と、画像圧縮部52と、を備えている。
まず、原稿種認識部51について説明する。
原稿種認識部51は、画像圧縮部52における画像圧縮に先立ち、フィルタ処理部22で空間フィルタを施された出力(RGB信号、z信号)にかかる注目原稿の画素値のヒストグラムを利用して、該原稿を下記の4種の内のいずれかであるかを判定する。加えて、原稿種認識部51は、白抜き文字が新聞原稿内に存在する可能性が有るか無いかを判定する。なお、白抜き文字が存在する可能性が有るか無いかについては、新聞原稿に限るものではなく、トナーセーブモードでの出力画像である薄い原稿、絵柄などの画像であるその他の原稿についても判定するようにしても良い。
・文字のみ原稿
・新聞原稿(白抜き文字有り)
・新聞原稿(白抜き文字無し)
・薄い原稿
・その他の原稿
ここで、図10は原稿種認識部51における原稿種認識処理の流れを概略的に示すフローチャートである。
図10に示すように、原稿種認識部51は、まず、原稿種認識にかかる原稿上の判定領域の特定を行う(ステップS1)。より詳細には、原稿種認識部51は、後段のステップS2において一画面のヒストグラムを作成する際に用いる原稿上の判定領域を特定する。原稿上においてヒストグラム作成に用いない領域は二つある。ここで、図11はヒストグラムを作成する際に用いる原稿上の判定領域を示す模式図である。図11に示すように、第1には、原稿における上下左右の端部からそれぞれ10%の領域である。第2には、エッジ領域を表すz信号がアクティブな画素、すなわち原稿における画像のエッジ部を除外する。前者は、原稿の影などの入り込みを排除し、後者は、文字と背景部の中間画素の入り込みを排除するものである。原稿の影や文字と背景部の中間画素は、絵柄でないにも係わらず絵柄と誤判定される種となりうるので、予め判定領域から排除するようにしたものである。
続いて、原稿種認識部51は、注目画素の画素値を複数の閾値で量子化した後、ヒストグラムを作成する(ステップS2)。すなわち、原稿種認識部51は、ヒストグラム作成部としても機能する。ここで、図12はヒストグラム作成例を示す図である。図12に示すように、原稿種認識部51は、フィルタ処理部22で空間フィルタを施された出力(RGB信号、z信号)にかかる原稿上の判定領域において濃度毎に画素数をカウントしてヒストグラムを作成し、作成したヒストグラムからピーク値を決定する。なお、原稿種認識部51は、図12に示すように、実験などにより決定する4つの閾値(閾値1〜閾値4)で濃度を下記に示すように5値化して分類する。
1.真の黒色
2.黒色
3.中間色
4.新聞地色(灰色)
5.白色
ここで、各閾値を決める方法を以下に示す。
[1.真の黒色と2.黒色の閾値]
・「1.真の黒色」を規定する閾値1は、新聞の文字色よりも低くする。[新聞原稿判定に影響]
[2.黒色と3.中間色の閾値]
・新聞の文字色が、「2.黒色」に分類されるようにする。[新聞原稿判定に影響]
・文字のみ原稿の文字色(特に黒文字)が、「2.黒色」に分類されるようにする。[文字のみ原稿に影響]
・薄い原稿の黒文字が、「3.中間色」に分類されるようにする。[薄い原稿判定に影響]
[3.中間色と4.新聞地色の閾値]
・新聞地色が、「4.新聞地色」に分類されるようにする。[新聞原稿判定に影響]
[4.新聞地色と5.白色の閾値]
・白地が、「5.白色」に分類されるようにする。[文字のみ原稿判定に影響]
・白抜き文字が、「5.白色」に分類されるようにする。[白抜き文字判定に影響]
続いて、原稿種認識部51は、白抜き文字の有無の判定を行う(ステップS3)。文字領域において、白抜き文字は、黒文字よりも太く、かつ、上述の判定領域の特定(ステップS1)において画像のエッジ部を除かれることにより、「5:白色」にカウントされることになる。そこで、原稿種認識部51は、この性質を利用して、文字領域において「5:白色」にカウントされる場合、白抜き文字有りと判定する(ステップS3のYes)。
一方、原稿種認識部51は、白抜き文字無しと判定した場合(ステップS3のNo)、白抜き文字(もしくは白地)が無いという情報を一時的に記憶し、新聞原稿、薄い原稿、その他の原稿の白抜き文字検出時に利用する(ステップS4)。
続いて、原稿種認識部51は、原稿が薄い原稿であるか否かの判定を行う(ステップS5)。薄い原稿は、「3.中間色」〜「5.白色」が多くを占め、「1.真の黒色」と「2.黒色」が少ない。そこで、原稿種認識部51は、この性質を利用して、各カウント値に対して閾値判定する。原稿種認識部51は、薄い原稿であると判定した場合(ステップS5のYes)、ステップS6に進み、原稿の種別を「薄い原稿」とする。
続いて、薄い原稿でないと判定した場合(ステップS5のNo)、原稿種認識部51は、原稿が新聞原稿であるか否かの判定を行う(ステップS7)。新聞原稿は、「4.新聞地色」が多くを占め、「1.真の黒色」と「3.中間色」が少ない。そこで、原稿種認識部51は、この性質を利用して、各カウント値に対して閾値判定する。原稿種認識部51は、新聞原稿であると判定した場合(ステップS7のYes)、ステップS8に進み、原稿の種別を「新聞原稿」とする。
続いて、新聞原稿でないと判定した場合(ステップS7のNo)、原稿種認識部51は、原稿が文字のみ原稿であるか否かの判定を行う(ステップS9)。文字のみ原稿は、「1.真の黒色」、「2.黒色」、「5.白色」が多くを占め、「3.中間色」、「4.新聞地色」が少ない。そこで、原稿種認識部51は、この性質を利用して、各カウント値に対して閾値判定する。原稿種認識部51は、文字のみ原稿であると判定した場合(ステップS9のYes)、ステップS10に進み、原稿の種別を「文字のみ原稿」とする。
一方、文字のみ原稿でないと判定した場合(ステップS9のNo)、原稿種認識部51は、ステップS11に進み、原稿の種別を「その他の原稿」とする。すなわち、原稿種認識部51は、薄い原稿でもなく新聞原稿でもなく文字のみ原稿でもないと判定された原稿をその他の原稿と判定する。
次に、画像圧縮部52について説明する。画像圧縮部52は、高圧縮PDF生成装置である。
画像圧縮部52は、HDD3へ一時保存された像域分離部21からの判定結果Xmoji(文字/非文字[絵柄])および判定結果Xiro(有彩色/無彩色)と、γ補正後の濃度リニア信号(RGB信号)とを受けて、高圧縮PDF用のデータを作成する。
次に、原稿種認識部51における原稿種認識結果を受けた画像圧縮部52における高圧縮PDFファイル作成の説明をする。
まず、高圧縮PDFの概要を説明する。
高圧縮PDFは、文字などの線画を含む画像から高圧縮PDFファイルを生成する画像圧縮技術である。ここで線画とは、文字および文字と同様に扱うことが望ましい線で表現されるオブジェクトを指す。線で表現されるオブジェクトであっても、絵柄として扱うことが望ましいオブジェクトは、線画ではなく絵柄に含まれるものとする。絵柄は、線画以外のオブジェクト、つまり、写真などの網点で表現されるオブジェクトや、文字と同様に扱うことが望ましくない図形などのオブジェクトである。
図13は、高圧縮PDFの処理手順を説明する模式図である。高圧縮PDFファイルを生成するには、まず、処理対象となる画像(以下、「入力画像」と呼ぶ)Im0から、黒文字の線画のみからなる2値画像である第1の画像レイヤ(黒文字レイヤ)Im1と、色文字の線画のみからなる2値画像である第2の画像レイヤ(色文字レイヤ)Im2と、線画の文字色(前景)を表現する多値画像である第3の画像レイヤ(前景レイヤ)Im3と、線画以外の絵柄(背景)を表現する多値画像である第4の画像レイヤ(背景レイヤ)Im4と、を生成する。そして、第1の画像レイヤIm1および第2の画像レイヤIm2に対しては、線画の圧縮に適した圧縮処理を施し、第3の画像レイヤIm3および第4の画像レイヤIm4に対しては、前景(文字色)や背景の圧縮に適した圧縮処理を施す。その後、圧縮処理が施された第1の画像レイヤIm1と、圧縮処理が施された第2の画像レイヤIm2と、圧縮処理が施された第3の画像レイヤIm3と、圧縮処理が施された第4の画像レイヤIm4とを、例えばPDF形式の1つの画像ファイル上で統合することにより、入力画像Im0に対応する高圧縮PDFファイルFImを生成する。
第1の画像レイヤIm1および第2の画像レイヤIm2に対して施される圧縮処理は、例えば、2値画像に対するMMRなどの符号化方式による圧縮処理である。第3の画像レイヤIm3および第4の画像レイヤIm4に対して施される圧縮処理は、例えば、多値画像に対するJPEGなどの符号化方式による圧縮処理である。第1の画像レイヤIm1に対する圧縮処理と第2の画像レイヤIm2に対する圧縮処理は、線画の圧縮に適した圧縮処理である点で共通するため、以下ではこれらの処理を総称して「第1の圧縮処理」と呼ぶ。一方、第3の画像レイヤIm3および第4の画像レイヤIm4に対する圧縮処理は、絵柄や背景の圧縮に適した圧縮処理であるため、以下では、線画の圧縮に適した第1の圧縮処理と区別して、「第2の圧縮処理」と呼ぶ。なお、上述の符号化方式は一例であり、上述の例とは異なる符号化方式による圧縮処理を行ってもよい。
高圧縮PDFでは、以上のように、処理対象の入力画像Im0を線画の領域とそれ以外の絵柄や背景の領域とに分離し、線画の領域に対しては第1の圧縮処理を施すとともに、線画以外の絵柄や背景の領域に対しては第2の圧縮処理を施すことで、圧縮の効率を高めている。ここで、圧縮の効率とは、画像を再現したときの画質(再現性)をあまり損なわずに、どれだけ圧縮率を高めることができたかどうかを表し、再現性を維持しながら高い圧縮率が得られれば、効率のよい圧縮が行われたことになる。
上述の高圧縮PDFは様々な変形が可能である。
次に、画像圧縮部52における画像圧縮処理について説明する。
ここで、図14は画像圧縮部52における画像圧縮処理の流れの一例を示すフローチャートである。図14に示すように、まず、画像圧縮部52は、原稿種のパターンに応じたγ補正パラメータで原稿(入力画像)に対してγ補正を実施する(ステップS31)。
ここで、原稿種のパターンとγ補正の関係について説明する。γ補正によって背景色が濃くなる順は、下記の順序である。
薄い原稿>その他の原稿>=白抜き文字有り新聞原稿=白抜き文字無し新聞原稿>文字のみ原稿
ここで、図15は各原稿種のγ補正パラメータを規定するγ補正テーブルの一例を示す図である。
1.文字のみ原稿
文字のみ原稿は、白地上に低輝度色の文字のみがあることを想定している。そのため、文字のみ原稿の場合、背景を薄くし文字を濃くするγ補正テーブル(図15(d)参照)を使うようにする。これにより、可読性の向上を図ることができる。
2.白抜き文字無し新聞原稿
白抜き文字無し新聞原稿は、新聞の地は高輝度色、文字は低輝度色であることが予測できる。そのため、白抜き文字無し新聞原稿の場合は、背景を薄くし文字を濃くするγ補正テーブル(図15(c)参照)を使うようにする。これにより、可読性の向上を図ることができる。ただし、文字のみ原稿よりは、緩めのγ補正テーブルを使う。また、地肌除去をユーザが指定している場合は、新聞の背景を白化し、文字のみを残しても良い。これにより、PDFファイルをプリントする際のトナー削減を実現し、環境配慮を図ることができる。
3.白抜き文字有り新聞原稿
白抜き文字有り新聞原稿の場合は、白抜き文字らしい文字は白化するγ補正テーブルを使うようにする。これにより、白抜き文字の可読性の向上を図ることができる。ただし、文字のみ原稿よりは、緩めのγ補正テーブルを使う。
4.薄い原稿
薄い原稿の場合は、背景と文字の両方を濃くするγ補正テーブル(図15(a)参照)を使うようにする。これにより、見栄えを良くすることができる。このとき、その他の原稿よりも濃くすることを特徴とする。
5.その他の原稿
その他の原稿の場合は、低輝度をより暗く、高輝度をより明るくするγ補正テーブル(図15(b)参照)を使うようにする。これにより、背景と文字の階調差を出し、見栄えを良くすることができる。ただし、階調性が損なわれるのを防ぐため、緩やかなγ補正テーブルを使う。
次いで、画像圧縮部52は、γ補正を実施した後、線画データを利用して、第1の画像レイヤ、第2の画像レイヤ、第3の画像レイヤ、第4の画像レイヤを生成する(ステップS32)。
ここで、原稿種のパターンと解像度の関係について説明する。図16は、原稿種に応じて変換される各レイヤの解像度を示す図である。図16に示すように、文字のみ原稿や新聞原稿は、背景の画像レイヤ(第4の画像レイヤ)の圧縮を高くする。文字のみ原稿や新聞原稿は、絵柄が含まれている可能性が低く、文字の抽出精度が高いため、背景の圧縮を高くしても画質への影響は少ないことを利用したものである。
なお、原稿種に応じて解像度を切り替えるのではなく、原稿種に応じてJPEGなどのQF(Quality Factor:品質係数)を変えて、小ファイルサイズ化を実現しても良い。
次いで、画像圧縮部52は、第1の画像レイヤおよび第2の画像レイヤについてMMRやJBIG2などの可逆圧縮を実施して出力する(ステップS33,S34)。また、画像圧縮部52は、第3の画像レイヤと第4の画像レイヤについてJPEGやJPEG2000など非可逆圧縮を実施して出力する(ステップS35,S36)。
このように本実施の形態によれば、入力画像の原稿種認識について注目画素の画素値を複数の閾値で量子化して作成したヒストグラムを利用して行うが、その前処理として絵柄領域における特定の線数以上の網点ドットを除去する平滑化処理と文字領域のエッジ部に対してエッジ量に応じたエッジ強調処理を施すようにしたので、少なくとも下記の4種類の原稿種を同じ判定方式を用いた簡単な構成で分類することができる。
・文字のみ原稿
・新聞原稿
・薄い原稿
・その他の原稿
また、本実施の形態によれば、認識された原稿種に応じ、高圧縮画像ファイルを生成する圧縮処理にかかる圧縮方式を制御するので、高画質・高圧縮・高速な圧縮を実現することができる。
なお、本実施の形態においては、原稿種認識の結果に基づいて高圧縮PDFファイル作成時の処理を制御するような例を示した。しかしながら、これに限るものではなく、スキャナ1によりコピー画像を得る際にも、原稿種認識部51を作動し、その結果を使って画像処理装置2の後段側の色処理/UCR部24やプリンタ補正部25を制御してもなんら構わない。一例を挙げれば、薄い原稿と判断された時には、プリンタ補正部25において、画像が濃く再生される(所謂立った)γ補正処理を施せば良い。これにより、プリンタ出力の際にも画像の高画質化が期待できる。
(第2の実施の形態)
次に、第2の実施の形態について説明する。なお、前述した第1の実施の形態と同じ部分は同じ符号で示し説明も省略する。
第1の実施の形態では、平滑化回路221において局所的な平滑化フィルタを用いて網点を除去した。しかしながら、平滑化処理を局所的に行う以上、荒い網点線数など除去しきれないものは存在する。網点は元来二値的な構造をしており、これが完全に除去されないと、ヒストグラムにおける中間値を持つ画素が少なくなり、網点絵柄部分であっても文字領域と判断される可能性が高くなる。
そこで、第2の実施の形態では、文字のみ原稿の判定精度を高めるべく、網点絵柄、特に中間部の特徴に注目する。そして、第2の実施の形態では、確実に網点絵柄が存在する場合には、ヒストグラムの結果によらず、文字のみ原稿とは判定されないようにした点で、第1の実施の形態とは異なるものとなっている。
図17は、第2の実施の形態にかかる像域分離部31の構成を示すブロック図である。図17に示す本実施の形態の像域分離部31は、スキャナ1が読み取ったデータ(A/D変換後のr,g,b:各色8ビット:反射率リニア)に対して、領域の分離を行う。像域分離部31からの出力Xは、3ビット信号であり、文字/非文字領域信号、色/非色領域信号、原稿種認識用網点/非網点領域信号である。
像域分離部31の網点検出回路3113は、第1の実施形態で説明した総合判定回路2114への出力(網点分離結果1)に加えて、原稿種認識に反映するための網点分離結果2である判定結果Xamiをフィルタ処理部22に出力する。網点分離結果1は、網点全域、つまり網点ドットでできている領域の検出を目的としたものである。一方、網点分離結果2は、網点文字に少なく網点絵柄に多い網点率50%付近の網点領域の検出を目的としたものである。
ここで、網点検出回路3113について詳述する。図18は網点検出回路3113の構成を示すブロック図である。図18に示すように、網点検出回路3113は、山ピーク検出回路311と、谷ピーク検出回路312と、総合判定回路313と、補正判定回路314と、を備えている。
まず、網点分離結果1の出力について説明する。
図18に示すように、山ピーク検出回路311および谷ピーク検出回路312は、γ補正後の濃度リニアのG信号から、図3(a)〜(c)に示す如き3×3画素サイズのマトリックス(M=3)、4×4画素サイズのマトリックス(M=4)あるいは5×5画素サイズのマトリックス(M=5)を順次適用し、当該マトリックスの中心画素m(図3(a)〜(c)参照)が濃度変化の山または谷を示す極点(山ピーク画素、谷ピーク画素)であるか否かを周囲の画素m〜mとの濃度関係から検出する。この時の検出に用いる閾値をΔmth1とする。
次に、総合判定回路313は、N×N画素(但し、N>M)からなるブロックB、例えば図4に示すような9×9画素サイズ(N=9)からなるブロックBを単位として画像を分割する。
そして、総合判定回路313は、ブロックごとに山を示す極点画素数(山ピーク画素数)と谷を示す極点画素数(谷ピーク画素数)とをそれぞれ計数し、計数値の大きい側の極点画素数を当該ブロックの極点画素数として決定する。その後、網点検出回路2113は、図5に示す注目ブロックBの極点画素数Pと、これを囲む上下左右斜めの各周囲ブロックB〜Bの各極点画素数Pとの関係から当該注目ブロックBの中心画素n(図4参照)、あるいは当該注目ブロックB内の全ての画素n〜n80が網点領域に属するか否かを判定する。すなわち、補正判定回路314は、注目ブロックと周囲ブロックの各ブロック内の極点数に基づき、注目ブロックが網点ブロックか否かを判定し、網点分離結果1を出力する。
次に、網点分離結果2の出力について説明する。
ここで、網点文字(文字のみ原稿と判定される原稿に含まれていても可)と網点絵柄の特徴について述べる。
[1.網点文字]
・二次元的な広がりは小さい(文字なので一般的に細い)。
・中間濃度が含まれる可能性は低い(山ピーク画素、谷ピーク画素が局所的に同時に含まれる可能性は低い)。
[2.網点絵柄]
・二次元的な広がりを持つ(絵なので一般的に面積が広い)。
・中間濃度が含まれる可能性が高い。
本実施の形態では、上記のような網点文字および網点絵柄の特徴に基づき、網点絵柄の一部である網点ブロックを検出する処理の例について説明する。なお、本実施の形態においては、チェッカー状(網点率50%)の網点文字は少ないと思われ、仮にあっても、文字であれば面積は広くないはずである、と言う思想に基づいている。
網点分離結果2を得る場合には、山ピーク検出回路311および谷ピーク検出回路312は、濃度変化の山または谷を示す極点(山ピーク画素、谷ピーク画素)の検出に用いる閾値をΔmth2(Δmth2>Δmth1)に切り替える。このように閾値を変更するのは、中間濃度付近の網点は山の高さ及び谷の深さがそれぞれハイライト部及びダーク部に比べ大きいため、中間濃度付近の網点を限定するためである。
中間濃度付近の網点は、山ピーク及び谷ピークの数が概ね等しくなる。そこで、網点分離結果2を得る場合、総合判定回路313は、山ピーク数と谷ピーク数の差がこの条件を満たす場合のみ従来の極点算出を行い、満たさない場合には極点数を「0」として出力すれば良い。
あるいは、網点分離結果2を得る場合、総合判定回路313は、注目ブロック(8×8画素)のG信号の平均値を求め、平均値がある範囲に入った時が、注目ブロックを中間濃度ブロックとして判断し、その場合のみ従来の極点算出を行い、満たさない場合には極点数を「0」として出力すれば良い。
網点絵柄は、網点文字に比べ広い領域で存在する。そこで、網点分離結果2を得る場合、補正判定回路314は、利用する閾値を従来の網点分離結果1の時の閾値より大きなものに切り替える。
次に、本実施の形態の画像圧縮処理装置5の原稿種認識部51における処理について説明する。ここで、図19は原稿種認識部51における原稿種認識処理の流れを概略的に示すフローチャートである。
原稿種認識部51は、ヒストグラム作成後(ステップS2)、網点ブロックを計数する(ステップS20)。より詳細には、ステップS20において、原稿種認識部51は、判定結果Xamiのアクティブブロック数を計数する。
そして、原稿種認識部51は、ステップS9における原稿が文字のみ原稿であるか否かの判定の際に、その計数値が所定の数以上の場合には、文字のみ原稿ではないと判断すれば良い。
すなわち、図19のフローチャートに示すように、薄い原稿でなく(ステップS5のNo)、新聞原稿でない時に(ステップS7のNo)、網点の中間濃度部が含まれているならば、文字のみ原稿ではないとして(ステップS9のNo)、その他の原稿と判定することになる(ステップS11)。
このように本実施の形態によれば、入力画像に所定の数以上の網点絵柄領域が含まれている場合には、ヒストグラムを利用した認識結果にかかわらず、絵柄を含む原稿種として認識する。これにより、さらに高精度に、「文字のみ原稿」を他の原稿から分類することができる。「文字のみ原稿」の判定については、平滑化処理で潰しきれない大きなサイズの網点が文字に似ているため、網点絵柄があっても文字のみ原稿と判定されることもあったが、網点絵柄領域を積極的に判断するので、「文字のみ原稿」の判定精度を上げることができる。
(第3の実施の形態)
次に、第3の実施の形態について説明する。なお、前述した第1の実施の形態または第2の実施の形態と同じ部分は同じ符号で示し説明も省略する。
第3の実施の形態では、「薄い原稿」について更にパターン分類し、パターン毎に圧縮方式を制御するようにしたものである。
図20は、第3の実施の形態にかかる原稿種認識部51により判定される「薄い原稿」のパターン例を示す図である。図20に示すように、原稿種認識部51は、薄い原稿に対して、さらに以下のようなパターンに分類する。
薄い原稿(a):色地(3.中間色、4.新聞地色)が大部分を占め、白抜き文字が無い(5.白色が閾値以下)
薄い原稿(b):色地(3.中間色、4.新聞地色)が大部分を占め、白抜き文字が有る(5.白色が閾値以上)
薄い原稿(c):色地か白地か判断できない、もしくは、絵柄などにより色数が多い
薄い原稿(d):白地(5.白色)が大部分を占め、色数が2色(灰+その他の色)
薄い原稿(e):白地が大部分を占め、白以外の色数が1色のみ
薄い原稿(f):白紙原稿もしくは、ほぼ白紙原稿(少し文字があるなど)
原稿種認識部51は、薄い原稿について、パターンに応じて2値化の方式、閾値を切り替える。ここで、動的閾値2値化は、周囲画素の平均階調値の差が閾値以上であれば、線画候補画素として分離する手法を例にして説明する。
薄い原稿(a),(b)の場合は、背景と線画に階調差が無いことが予想できる。そのため、薄い原稿(a),(b)の場合、原稿種認識部51は、かなり低い閾値の動的閾値2値化を使う。より詳細には、凹凸があれば、なるべく拾う閾値である。
薄い原稿(c)の場合は、背景と線画に階調差が少しはあることが予想できる。そのため、薄い原稿(c)の場合、原稿種認識部51は、低い閾値の動的閾値2値化を使う。
薄い原稿(d),(e)の場合は、背景と線画に階調差がかなりあることが予想できる。そのため、薄い原稿(d),(e)の場合、原稿種認識部51は、ヒストグラムの谷を使うような閾値の固定閾値2値化を使う。加えて、薄い原稿(d),(e)は、薄い原稿(c)と区別のために、色数を見る必要がある。したがって、原稿種認識部51は、線画ごとの色を判定するため、原稿全体の色数をカウントすることで、薄い原稿(d),(e)の判定が可能になる。もちろん、薄い原稿(d)の場合、色ごとに原稿全体で線画色を2色で統一しても良い。また、薄い原稿(e)の場合は、原稿全体で線画色を1色にしても良い。
薄い原稿(f)の場合は、背景と線画に階調差がかなりあることが予想できるが、ヒストグラムの谷が無い可能性がある。そのため、薄い原稿(f)の場合、原稿種認識部51は、白以外と判定できるような閾値の固定閾値2値化を使う。
次に、画像圧縮部52における「薄い原稿」のパターン例に対する圧縮処理について説明する。
画像圧縮部52は、原稿に対してγ補正を実施する。画像圧縮部52は、薄い原稿種のパターンによってγ補正パラメータを切り替える。以下において、薄い原稿種のパターンによるγ補正の狙いについて説明する。
ここで、図21は薄い原稿種の各パターンのγ補正パラメータを規定するγ補正テーブルの一例を示す図である。
[薄い原稿(a),(b)]
白色が原稿に少ないため、図21のγ補正テーブル3を使うと、ファイルサイズが増える。よって、γ補正テーブル2を使う。γ補正テーブル2,3,4は、全体的に暗くする。数字が増えるにつれて暗くなる。
[薄い原稿(c)]
白色の領域がかなり多いため、図21のγ補正テーブル3を使っても、ファイルサイズがあまり増えない。よって、γ補正テーブル3を使う。また、白色領域の画素数によって、薄い原稿(a),(b),(c)のγ補正テーブルを計算し、ファイルサイズの変動を抑えても良い。
[薄い原稿(d)]
白地であり、背景から文字を分離しやすいため、γ補正テーブル4を使っても、ファイルサイズが増えない。
[薄い原稿(e)]
薄い原稿(d)よりも、さらに背景から文字を分離しやすいため、γ補正テーブル4よりも濃くするようなテーブルを使っても良いし、背景に白地しか残ってない場合は、背景全体を白化しても良い。
[薄い原稿(f)]
背景に白地しか残ってない場合は、背景全体を白化しても良い。また、γ補正テーブル5のように、階調性を減らし、ファイルサイズを減らしても良い。γ補正テーブル5は、階調性を減らすことが目的であり、階段状のイメージである。階調性とファイルサイズのトレードオフの関係になる。
次に、画像圧縮部52における薄い原稿種の各パターンと解像度の関係について説明する。図22は、薄い原稿種の各パターンに応じて変換される各レイヤの解像度を示す図である。図22に示すように、薄い原稿(a),(b),(c)の場合、画像圧縮部52は、絵柄が含まれている可能性が高いため、あまり背景の解像度を下げることができない。薄い原稿(d)の場合、画像圧縮部52は、絵柄が含まれている可能性もあるため、背景の解像度を少しだけ下げる。薄い原稿(e),(f)の場合、画像圧縮部52は、絵柄が含まれている可能性が低いため、背景の解像度をかなり下げる。
また、薄い原稿(d),(e)の場合、黒文字が存在せず、色文字のみの可能性がある。薄い原稿(d),(e)の場合、画像圧縮部52は、黒文字レイヤを使わず、色文字レイヤだけを使うようにしても良い。よって、4レイヤのPDFを3レイヤに切り替えて、ファイルサイズの削減を図ることできる。
また、薄い原稿(e)の場合、色文字が存在せず、黒文字のみの可能性もある。薄い原稿(e)の場合、画像圧縮部52は、色文字レイヤを使わず、黒文字レイヤだけを使うようにしても良い。よって、4レイヤのPDFを3レイヤにして、ファイルサイズの削減を図ることができる。また、黒文字をK単色でプリントすることができるので、PDFファイルをプリントする際のトナー削減を実現することができる。
このように本実施の形態によれば、薄い原稿についての画像圧縮に際し、輝度値などを使った自動濃度補正により単純に補正する場合に比べ、ファイルサイズの削減を図ることができる。
図23は、画像形成装置100のハードウェア構成例を示すブロック図である。上述した第1の実施の形態ないし第3の実施の形態において説明した画像形成装置100は、例えば図23に示すように、コントローラ210と、オペレーションパネル220と、FCU(Facsimile Control Unit)230と、USB(Universal Serial Bus)デバイス240と、MLB(Media Link Board)250と、スキャナ1と、プロッタ4とを備える。
オペレーションパネル220は、画像形成装置100を使用するユーザが各種の設定入力を行ったり、ユーザに提示する各種情報を表示したりするユーザインタフェースである。上述のユーザによる動作モードの選択は、例えば、このオペレーションパネル220を用いて行われる。
FCU230は、画像形成装置100のファクシミリ機能を制御する制御ユニットである。USBデバイス240は、USBにより画像形成装置100に接続される機器である。MLB250は、画像データのフォーマット変換を行う変換ボードである。スキャナ1は原稿の読み取りを行うエンジンであり、プロッタ4は印刷を行うエンジンである。本実施形態では、スキャナ1による原稿の読み取りによって、処理対象の画像が取得されるものとする。
コントローラ210は、画像形成装置100の動作を制御する制御装置である。コントローラ210は、図23に示すように、CPU(Central Processing Unit)211と、システムメモリ213と、HDD3と、PHY(Physical Layer:通信系回路の物理階層)214と、ASIC(Application Specific Integrated Circuit)215とを含む。オペレーションパネル220は、コントローラ210のASIC215に接続されている。また、FCU230、USBデバイス240、MLB250、スキャナ1およびプロッタ4は、データ転送バス280を介してコントローラ210のASIC215に接続されている。
第1の実施の形態ないし第3の実施の形態において説明した画像形成装置100では、上述の画像処理装置としての機能的な構成要素の一部または全部が、主にコントローラ210によって実現される。すなわち、第1の実施の形態ないし第3の実施の形態において説明した機能的な構成要素のうち、画像処理装置2は、例えば、コントローラ210のASIC215により実現される。また、画像圧縮処理装置5は、例えば、コントローラ210のCPU211がシステムメモリ213を利用して所定のプログラム(ソフトウェア)を実行することにより実現される。
なお、上記プログラムは、画像形成装置100にインストール可能な形式または実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVDなどのコンピュータで読み取り可能な記録媒体に記録して提供される。また、上記プログラムを、インターネットなどのネットワークに接続されたコンピュータ上に格納し、ネットワーク経由で画像形成装置100にダウンロードさせることにより提供するように構成してもよい。さらに、上記プログラムを、インターネットなどのネットワーク経由で提供または配布するように構成してもよい。また、上記プログラムを、例えば画像形成装置100内のシステムメモリ213やHDD3などに予め組み込んで提供するようにしてもよい。
また、上述した第1の実施の形態ないし第3の実施の形態では、画像形成装置100を単体の装置として実現する例を想定したが、画像形成装置100の機能的な構成要素を物理的に分離した複数の装置に分散して設け、これら複数の装置の連携により、画像形成装置100としての動作が実現されるように構成してもよい。
なお、上述した第1の実施の形態ないし第3の実施の形態では、本発明の原稿種認識装置を、コピー機能、プリンタ機能、スキャナ機能およびファクシミリ機能のうち少なくとも2つの機能を有する複合機に適用した例を挙げて説明したが、複写機、プリンタ、スキャナ装置、ファクシミリ装置などの画像形成装置であればいずれにも適用することができる。
1 原稿種認識装置
21 像域分離部
51 原稿種認識部、ヒストグラム作成部
52 画像圧縮部
221 平滑化部
223 エッジ強調部
特許第4861711号公報

Claims (10)

  1. 入力画像の文字領域と絵柄領域とを分離した各領域を示す信号を出力する像域分離部と、
    前記入力画像の前記絵柄領域における特定の線数以上の網点ドットを除去する平滑化処理を施す平滑化部と、
    前記平滑化処理を施した前記入力画像における前記文字領域のエッジ部に対してエッジ量に応じたエッジ強調処理を施した画像を出力するエッジ強調部と、
    前記エッジ強調処理を施した画像にかかるヒストグラムを作成するヒストグラム作成部と、
    前記ヒストグラムを利用して前記入力画像にかかる原稿種を認識する原稿種認識部と、
    を備えることを特徴とする原稿種認識装置。
  2. 前記原稿種認識部は、前記ヒストグラム作成部によって作成されたヒストグラムを複数の閾値で量子化した結果に基づいて、前記入力画像にかかる原稿種を認識する、
    ことを特徴とする請求項1記載の原稿種認識装置。
  3. 前記エッジ強調部は、前記エッジ量に基づくエッジ領域を表す信号を更に出力し、
    前記ヒストグラム作成部は、前記エッジ領域を表す信号がアクティブな画素を前記ヒストグラムの算出から除外する、
    ことを特徴とする請求項1または2記載の原稿種認識装置。
  4. 前記像域分離部は、前記入力画像から網点文字に少なく網点絵柄に多い特定の網点率の網点絵柄領域を更に検出し、
    前記原稿種認識部は、前記入力画像に所定の数以上の前記網点絵柄領域が含まれている場合には、前記ヒストグラムを利用した認識結果にかかわらず、絵柄を含む原稿種として認識する、
    ことを特徴とする請求項1ないし3の何れか一記載の原稿種認識装置。
  5. 前記像域分離部は、網点文字に少なく網点絵柄に多い特定の網点率をおよそ50%とする、
    ことを特徴とする請求項1ないし4の何れか一記載の原稿種認識装置。
  6. 前記原稿種認識部は、文字のみ原稿と、新聞原稿、トナーセーブモードでの出力画像である薄い原稿と、を認識する、
    ことを特徴とする請求項1ないし5の何れか一記載の原稿種認識装置。
  7. 前記原稿種認識部は、前記エッジ領域を表す信号がアクティブな画素を前記ヒストグラムの算出から除外する性質を利用して、白抜き文字の有無を更に認識する、
    ことを特徴とする請求項3ないし5の何れか一記載の原稿種認識装置。
  8. 請求項1ないし7の何れか一記載の原稿種認識装置を備えることを特徴とする画像形成装置。
  9. 原稿種認識装置で実行される原稿種認識方法であって、
    入力画像の文字領域と絵柄領域とを分離した各領域を示す信号を出力する像域分離工程と、
    前記入力画像の前記絵柄領域における特定の線数以上の網点ドットを除去する平滑化処理を施す平滑化工程と、
    前記平滑化処理を施した前記入力画像における前記文字領域のエッジ部に対してエッジ量に応じたエッジ強調処理を施した画像を出力するエッジ強調工程と、
    前記エッジ強調処理を施した画像にかかるヒストグラムを作成するヒストグラム作成部工程と、
    前記ヒストグラムを利用して前記入力画像にかかる原稿種を認識する原稿種認識工程と、
    を含むことを特徴とする原稿種認識方法。
  10. コンピュータを、
    入力画像の文字領域と絵柄領域とを分離した各領域を示す信号を出力する像域分離部と、
    前記入力画像の前記絵柄領域における特定の線数以上の網点ドットを除去する平滑化処理を施す平滑化部と、
    前記平滑化処理を施した前記入力画像における前記文字領域のエッジ部に対してエッジ量に応じたエッジ強調処理を施した画像を出力するエッジ強調部と、
    前記エッジ強調処理を施した画像にかかるヒストグラムを作成するヒストグラム作成部と、
    前記ヒストグラムを利用して前記入力画像にかかる原稿種を認識する原稿種認識部と、
    として機能させるためのプログラム。
JP2016055991A 2016-03-18 2016-03-18 原稿種認識装置、画像形成装置、原稿種認識方法およびプログラム Active JP6648580B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2016055991A JP6648580B2 (ja) 2016-03-18 2016-03-18 原稿種認識装置、画像形成装置、原稿種認識方法およびプログラム
US15/457,143 US10115011B2 (en) 2016-03-18 2017-03-13 Document type recognition apparatus, image forming apparatus, document type recognition method, and computer program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016055991A JP6648580B2 (ja) 2016-03-18 2016-03-18 原稿種認識装置、画像形成装置、原稿種認識方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2017175213A true JP2017175213A (ja) 2017-09-28
JP6648580B2 JP6648580B2 (ja) 2020-02-14

Family

ID=59855737

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016055991A Active JP6648580B2 (ja) 2016-03-18 2016-03-18 原稿種認識装置、画像形成装置、原稿種認識方法およびプログラム

Country Status (2)

Country Link
US (1) US10115011B2 (ja)
JP (1) JP6648580B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10523843B2 (en) 2017-11-14 2019-12-31 Ricoh Company, Ltd. Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
CN110784701A (zh) * 2018-07-30 2020-02-11 三星显示有限公司 显示设备及其图像处理方法
JP2020088734A (ja) * 2018-11-29 2020-06-04 株式会社リコー 画像処理装置、画像処理方法、およびプログラム
US10699110B2 (en) 2017-01-26 2020-06-30 Ricoh Company, Ltd. Image processing apparatus, image processing method, and non-transitory recording medium storing program for causing computer to execute image processing method

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10121226B2 (en) * 2014-11-21 2018-11-06 Rakuten, Inc. Information processing device, information processing method, and information processing program
JP2019161554A (ja) * 2018-03-15 2019-09-19 キヤノン株式会社 画像処理装置、画像処理方法、及び、プログラム
CN111444750B (zh) * 2019-01-17 2023-03-21 珠海金山办公软件有限公司 一种pdf文档识别方法、装置及电子设备
JP7259491B2 (ja) * 2019-04-01 2023-04-18 富士フイルムビジネスイノベーション株式会社 画像処理装置及びプログラム
CN110349530B (zh) * 2019-06-12 2021-07-23 北海惠科光电技术有限公司 文字边界的处理方法、显示面板及计算机可读存储介质
US11282187B2 (en) 2019-08-19 2022-03-22 Ricoh Company, Ltd. Inspection system, inspection apparatus, and method using multiple angle illumination
JP7404875B2 (ja) 2020-01-06 2023-12-26 株式会社リコー 検査システム、情報処理装置およびプログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2899461B2 (ja) 1990-12-20 1999-06-02 株式会社リコー 色信号補間方法、色信号補間装置および色補正方法
US5311332A (en) 1990-12-20 1994-05-10 Ricoh Company, Ltd. Interpolation method and color correction method using interpolation
JP4172616B2 (ja) 2001-09-21 2008-10-29 株式会社リコー 画像処理装置
JP2003153006A (ja) 2001-11-16 2003-05-23 Ricoh Co Ltd 画像処理装置
JP4861711B2 (ja) 2005-07-27 2012-01-25 株式会社リコー 画像処理装置、画像圧縮方法、画像圧縮プログラム及び記録媒体
JP2008153725A (ja) * 2006-12-14 2008-07-03 Ricoh Co Ltd 画像処理装置、画像処理方法、画像表示印刷制御装置、画像表示印刷制御方法、プログラムおよび記録媒体
US8223401B2 (en) 2007-12-05 2012-07-17 Ricoh Company, Limited Image processing apparatus, image processing system, and image processing method
JP5220828B2 (ja) * 2010-11-11 2013-06-26 シャープ株式会社 画像処理装置、画像形成装置、画像読取装置、画像処理方法、プログラム及び記録媒体
JP5826081B2 (ja) * 2012-03-19 2015-12-02 株式会社Pfu 画像処理装置、文字認識方法及びコンピュータプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10699110B2 (en) 2017-01-26 2020-06-30 Ricoh Company, Ltd. Image processing apparatus, image processing method, and non-transitory recording medium storing program for causing computer to execute image processing method
US10523843B2 (en) 2017-11-14 2019-12-31 Ricoh Company, Ltd. Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
CN110784701A (zh) * 2018-07-30 2020-02-11 三星显示有限公司 显示设备及其图像处理方法
JP2020088734A (ja) * 2018-11-29 2020-06-04 株式会社リコー 画像処理装置、画像処理方法、およびプログラム
JP7077925B2 (ja) 2018-11-29 2022-05-31 株式会社リコー 画像処理装置、画像処理方法、およびプログラム

Also Published As

Publication number Publication date
US20170270359A1 (en) 2017-09-21
JP6648580B2 (ja) 2020-02-14
US10115011B2 (en) 2018-10-30

Similar Documents

Publication Publication Date Title
JP6648580B2 (ja) 原稿種認識装置、画像形成装置、原稿種認識方法およびプログラム
KR100994644B1 (ko) 화상 처리 장치 및 그 방법
JP2007507802A (ja) デジタル画像におけるテキスト状エッジの強調
JP4637054B2 (ja) 画像処理装置及びその制御方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体
JP6705237B2 (ja) 画像圧縮装置、画像形成装置、画像圧縮方法およびプログラム
JP6923037B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP2019092027A (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP6740612B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP6676962B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP4212876B2 (ja) 画像処理装置および画像処理システム
JP3899872B2 (ja) 画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体
JP2003283821A (ja) 画像処理装置
JP4522978B2 (ja) 画像処理装置、画像処理方法、画像形成装置、画像処理プログラムおよび記録媒体
JP4526577B2 (ja) 画像処理装置および画像処理システムおよび画像処理方法
JP4963559B2 (ja) 画像処理装置、画像形成装置、画像処理方法、その方法をコンピュータに実行させるプログラム
JP2006262215A (ja) 画像処理装置、画像処理方法、画像処理プログラム、および該プログラムを記録した記録媒体
JP2007189275A (ja) 画像処理装置
JP7413751B2 (ja) 画像処理システムおよびプログラム
JP2012231419A (ja) 画像圧縮装置、画像形成装置、画像読取装置、画像圧縮方法、コンピュータプログラム、及び、記録媒体
JP2017118299A (ja) 画像処理装置、画像処理方法およびプログラム
JP2005039484A (ja) 画像処理装置
JP2023109520A (ja) 画像処理装置
JP4412339B2 (ja) 画像形成装置および画像データの補正方法
JP2018174419A (ja) 画像処理装置、および、コンピュータプログラム
JP2006094042A (ja) 画像処理装置および画像処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190909

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191001

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191202

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191217

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191230

R151 Written notification of patent or utility model registration

Ref document number: 6648580

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151