JP5796392B2 - 画像処理装置、および、コンピュータプラグラム - Google Patents

画像処理装置、および、コンピュータプラグラム Download PDF

Info

Publication number
JP5796392B2
JP5796392B2 JP2011167178A JP2011167178A JP5796392B2 JP 5796392 B2 JP5796392 B2 JP 5796392B2 JP 2011167178 A JP2011167178 A JP 2011167178A JP 2011167178 A JP2011167178 A JP 2011167178A JP 5796392 B2 JP5796392 B2 JP 5796392B2
Authority
JP
Japan
Prior art keywords
region
image
uniform
pixel
band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011167178A
Other languages
English (en)
Other versions
JP2013031106A (ja
Inventor
良平 小澤
良平 小澤
近藤 真樹
真樹 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP2011167178A priority Critical patent/JP5796392B2/ja
Priority to EP12178349.2A priority patent/EP2551824B1/en
Priority to US13/562,212 priority patent/US8830529B2/en
Publication of JP2013031106A publication Critical patent/JP2013031106A/ja
Application granted granted Critical
Publication of JP5796392B2 publication Critical patent/JP5796392B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/77Determining position or orientation of objects or cameras using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/96Management of image or video recognition tasks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20076Probabilistic image processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Editing Of Facsimile Originals (AREA)

Description

本発明は、対象画像の特徴を判定する技術に関する。
対象画像を表す画像データに基づいて、対象画像の特徴(例えば、対象画像におけるオブジェクト領域の領域)を特定する技術が知られている。対象画像の特徴を正しく特定できれば、特徴に応じた画像処理を施すことができる等のメリットがある。特許文献1には、対象画像の特徴を特定する技術において、省メモリのために、原画像データ(例えば、600dpi)を、原画像データより低解像度の画像データ(例えば、300dpi)に変換している。そして、低解像度の画像データを用いて、対象画像の特徴を特定している。
特開2004−362541号公報
しかしながら、低解像度の画像データを用いると情報量が足りないために、例えば、オブジェクト領域を精度良く特定することができない場合があった。
本発明の主な利点は、必要メモリ量を過剰に大きくすることなく、対象画像における領域を精度良く特定する技術を提供することである。
本発明は、上述の課題の少なくとも一部を解決するためになされたものであり、以下の態様で実現することが可能である。
対象画像データが示す対象画像を、複数のバンド画像に分割する分割部と、前記複数のバンド画像を順次に処理して、各バンド画像を、所定基準より均一な領域である均一領域と、前記所定基準より均一でない領域である非均一領域とに区分する区分部と、前記対象画像の領域を特定するための領域情報を更新する領域情報更新部であって、先に処理された第1のバンド画像の第1の均一領域と、処理対象である第2のバンド画像の第2の均一領域とが、第1の隣接関係を有する場合に、前記第1の均一領域と前記第2の均一領域と1つの均一領域として特定するように前記領域情報を更新し、前記第1のバンド画像の第1の非均一領域と、前記第2のバンド画像の第2の非均一領域とが、第2の隣接関係を有する場合に、前記第1の非均一領域と前記第2の非均一領域とを1つの非均一領域として特定するように前記領域情報を更新する、前記領域情報更新部と、を、備える画像処理装置。
上記構成の画像処理装置によれば、対象画像を複数のバンド画像のそれぞれを一単位として処理するので、必要なメモリ容量を低減することができる。さらに、均一領域同士の隣接関係、および、非均一領域同士の隣接関係に応じて、複数の領域を含む1つの領域を特定するように、領域情報を更新する。この結果、バンド画像単位で、対象画像を処理するにも拘わらず、精度良く、領域を特定することができる。
なお、本発明は、種々の形態で実現することが可能であり、画像処理サーバ、画像処理システム、画像処理方法、これらの機能を実現するためのコンピュータプログラム、そのコンピュータプログラムを記録した記録媒体、等の形態で実現することができる。
実施例における画像処理装置としての複合機の構成を示すブロック図である。 画像処理の処理ステップを示すフローチャートである。 対象画像データが表す対象画像の一例を示す図である。 バンド画像単位での画像処理について説明する図である。 領域結合処理について説明する第1の図である。 領域結合処理について説明する第2の図である。 領域結合処理について説明する第3の図である。 属性判定処理について説明する説明図である。 上述した画像処理の結果を概念的に示す図である。 本実施例の効果について説明する図である。 変形例におけるラインデータの組を示す図である。
A.実施例:
A−1.複合機の構成:
次に、本発明の実施の形態を実施例に基づき説明する。図1は、実施例における画像処理装置としての複合機200の構成を示すブロック図である。
複合機200は、CPU210と、ROMとRAMとを含む内部記憶装置240と、所定の方式で画像を印刷するプリンタ部250と、光電変換素子を用いて原稿を読み取るスキャナ部260と、タッチパネルなどの操作部270と、デジタルカメラ300やパーソナルコンピュータ400などの外部装置とデータ通信を行うための通信部280と、ハードディスクドライブやEEPROMなどの外部記憶装置290と、を備えている。
内部記憶装置240にはバッファ領域241が設けられている。具体的には、バッファ領域241は、バンド画像格納領域242と、隣接ライン格納領域243と、解析データ格納領域244と、を備えている。バンド画像格納領域242は、対象画像を複数に分割したバンド画像を表すバンド画像データを格納するための領域である。隣接ライン格納領域243は、バンド画像の上端および下端の1ライン分の画素についての識別子情報を格納するための領域である。解析データ格納領域244は、本実施例における画像処理において、生成する画像解析データ294を格納する領域である。
外部記憶装置290は、複合機200を制御するための種々のコンピュータプログラム291と、後述する画像処理において参照される判定テーブル292と、後述する画像処理の対象となる画像データ293とを格納している。また、外部記憶装置290は、後述する画像処理において生成された画像解析データ294を格納することができる。コンピュータプログラム291は、コンピュータ読み取り可能な記録媒体に記録された形態で提供され得る。ここでいう記録媒体は、着脱可能な記録媒体、計算機の内部記憶装置、計算機に接続される外部記憶装置を含む。画像データ293は、スキャナ部260を用いて原稿を読み取ることによって生成された画像データを含んでも良く、外部装置300、400から通信部280を介して取得された画像データを含んでも良い。
CPU210は、コンピュータプログラム291を実行することにより、後述する画像処理を実行する画像処理部M100として機能する。画像処理部M100は、バンド幅決定部M110と、画像分割部M120と、バンド画像処理部M130とを備えている。バンド画像処理部M130は、領域区分部M131と、領域情報更新部M132と、特徴情報更新部M133と、属性判定部M134と、を備えている。領域情報更新部M132は、識別情報更新部M1321を備えている。各機能部が実行する処理については後述する。
A−2.画像処理:
画像処理部M100は、画像データを用いて、画像データが表す画像の内容を判定する画像処理を実行する。図2は、画像処理の処理ステップを示すフローチャートである。
ステップS100では、画像処理部M100は、処理対象とする画像データ(対象画像データ)を選択する。例えば、画像処理部M100は、対象画像データを指定する指定指示を操作部270を介してユーザから受け付け、指定指示において指定された対象画像データを、外部記憶装置290に格納された複数の画像データ293の中から選択する。
図3は、対象画像データが表す対象画像Gの一例を示す図である。この対象画像Gは、背景画像Bg1と、文字を表すオブジェクトである第1の文字オブジェクトOb2および第2の文字オブジェクトOb4と、写真を表すオブジェクトである写真オブジェクトOb3と、描画を表すオブジェクトである描画オブジェクトOb5とを含んでいる。ここで、描画は、イラスト、表、線図、模様などを含む。以下では、対象画像データは、RGB画素データによって構成されたビットマップデータであるものとして説明する。
ステップS100の後、ステップS200では、画像処理部M100のバンド幅決定部M110は、サイズ情報を取得する。本実施例において取得されるサイズ情報は、対象画像Gにおける文字オブジェクトに含まれる文字の大きさを表す文字サイズCSと、対象画像Gの解像度Rである。文字サイズCSは、例えば、対象画像Gにおける文字オブジェクトに含まれる文字のうち、最もサイズが大きい文字の文字サイズである。文字サイズCSの単位は、例えば、pt(ポイント=(1/72)インチ)で表される。解像度Rの単位は、例えば、dpi(dots per inch)であり、1つの画素の大きさを表すサイズ情報と言うことができる。このサイズ情報は、例えば、対象画像データに関連付けられていても良い(具体的には、ヘッダに含まれていても良い)し、操作部270を介してユーザによって入力されても良い。
ステップS200の後、ステップS300では、バンド幅決定部M110は、文字サイズCSおよび解像度Rを用いて、バンド幅BWを決定する。バンド幅BWは、BW=CS×R×kで表される。kは、設計値である係数である。バンド幅BWは、画素の数で表される。
ステップS300の後、ステップS400では、画像処理部M100の画像分割部M120は、対象画像Gを表す対象画像データのうち、バンド幅BWが表す数のラスタラインを含む画像データ(バンド画像データ)を順次に取得する。この結果、対象画像Gは、例えば、図3に示すように、複数のバンド画像BDG1〜BDG4に分割されて、バンド画像単位で、後述するステップS500〜ステップS1400までの処理が行われる。なお、取得された処理対象のバンド画像を表すバンド画像データは、バンド画像格納領域242に格納される。
図4は、バンド画像単位での画像処理について説明する図である。図4では、対象画像Gの上端部分を含むバンド画像BDG1(図4(a))を処理対象としている場合について示している。バンド画像BDG1は、第1の文字オブジェクトOb2の上側部分と、写真オブジェクトOb3の上側部分を含んでいる(図4(a))。
ステップS400の後、ステップS500では、画像処理部M100のバンド画像処理部M130の領域区分部M131は、処理対象のバンド画像データを用いて、エッジ画像を表すエッジ画像データを作成する。図4(b)には、バンド画像BDG1に基づくエッジ画像Eが示されている。エッジ画像Eは、バンド画像BDG1における第1の文字オブジェクトOb2に対応するエッジオブジェクトEg2と、および、写真オブジェクトOb3に対応するエッジオブジェクトEg3とを含んでいる。エッジ画像データは、バンド画像データを構成する複数のRGB画素データの各成分値に対して、sobelフィルタを適用して得られる。エッジ画像データは、対象画像を構成する複数の画素にそれぞれ対応する複数のRGB画素データによって構成される。このRGB画素データは、対象画像の対応する画素のエッジ強度をR、G、Bの各成分値についてそれぞれ表した画素データである。なお、エッジ画像Eの作成には、Sobelフィルタに限らず、Prewittフィルタ、Robertsフィルタなど種々のエッジ検出用フィルタが利用できる。
ステップS500の後、ステップS600では、領域区分部M131は、エッジ画像データが表すエッジ画像に対して複数の単位ブロックBを設定する。単位ブロックBは、エッジ画像Eに対して格子状に配置されたブロックである。エッジ画像Eとバンド画像BDG1とは同じサイズ(縦および横の画素数)であるので、単位ブロックBはバンド画像BDG1に対して設定されると言うこともできる。単位ブロックBは、例えば、エッジ画像E(バンド画像BDG1)の画素を1単位として、その1単位の画素をN行×N列(Nは所定の自然数)に並べた大きさを有する。単位ブロックBは、後述するように、対象画像における領域を特定する際の最小の単位である単位領域である。Nの大きさは、任意の設計値とされるが、バンド幅BWより小さい値とされる。領域区分部M131は、単位ブロックBの設定に対応して、ブロック画像BG1を設定する(図4(c))。
ブロック画像BG1を構成する各画素(ブロック画素)BPは、上述した複数の単位ブロックBのそれぞれに対応している。ブロック画素BPの画素値は、対応する単位ブロックBに関する各種の情報(例えば、後述する領域識別情報)を表す値が用いられる。ブロック画像BG1が設定された段階では、全てのブロック画素BPの画素値が0にされる(初期化される)。
ステップS600の後、ステップS700では、領域区分部M131は、複数の単位ブロックBのそれぞれを、非均一ブロックおよび均一ブロックのうちのいずれかに分類する。例えば、領域区分部M131は、単位ブロックBごとに、エッジ強度(領域エッジ強度)を算出する。具体的には、領域区分部M131は、領域エッジ強度を示す特徴値として、単位ブロックB内の全てのエッジ画像の画素について、各成分値(R、G、B)の平均値(ERave、EGave、EBave)を算出する。そして、領域区分部M131は、単位ブロックBの領域エッジ強度と所定の基準値とを比較することによって、単位ブロックBを、均一ブロックおよび非均一ブロックのいずれかに分類する。均一ブロックは、領域エッジ強度が所定の基準値より小さい単位ブロックである。非均一ブロックは、領域エッジ強度が所定の基準値以上である単位ブロックである。例えば、領域区分部M131は、領域エッジ強度を示す上述した平均値(ERave、EGave、EBave)を、それぞれの値について定められた基準値(ETr、ETg、ETb)と比較する。この比較の結果、領域区分部M131は、ERave<ETr、かつ、EGave<ETg、かつ、EBave<ETbが成立する場合には、領域区分部M131は、処理対象の単位ブロックBを均一ブロックに分類する。逆に、ERave≧ETr、および、EGave≧ETg、および、EBave≧ETbのうちの少なくとも一つが成立する場合には、領域区分部M131は、処理対象の単位ブロックBを非均一ブロックに分類する。
ステップS700の後、ステップS800では、領域区分部M131は、単位ブロックBを複数のグループに分類して、グループごとに領域識別子を付すラベリング処理を実行する。図4(c)には、ラベリング処理後のブロック画像BG1の一例が示されている。領域区分部M131は、ブロック画像BG1において、非均一ブロックに分類された単位ブロックBに対応する複数のブロック画素BPであって互いに隣接する複数のブロック画素BPを同じグループとし、均一ブロックに分類された単位ブロックBに対応する複数のブロック画素BPであって互いに隣接する複数のブロック画素BPを同じグループとする。そして、領域区分部M131は、同じグループに属するブロック画素BPは同じ画素値を有し、異なるグループに属するブロック画素BPは異なる画素値を有するように、各ブロック画素BPの画素値を更新する。この結果、ブロック画像BG1において、同じ画素値を有するブロック画素BPで構成される画像領域が特定される。
図4(c)の例では、ブロック画像BG1において、3つの画像領域BA1〜BA3が特定されている。すなわち、ブロック画像BG1において、画素値「1」である画像領域BA1と、画素値「2」である画像領域BA2、画素値「3」である画像領域BA3とが特定されている。ブロック画像BG1において特定された画像領域BA1〜BA3に対応して、単位ブロックBを最小単位とする画像領域A1〜A3(図4(a))が、バンド画像BDG1において特定される。以上の説明から解るように、ラベリング処理後のブロック画像BG1の画素値は、バンド画像BDG1において特定された画像領域A1〜A3を識別する領域識別子であって、単位ブロックBごとに付された領域識別子である。
ここで、画像領域の「特定」は、対象画像Gにおける画像領域の最終的な特定に限らず、本画像処理において、バンド画像単位で処理を行う過程における一時的な画像領域の特定を含む。すなわち、本画像処理では、後述するように画像領域の特定結果を表す領域情報(後述する画像解析データ294に含まれる)が更新されることによって、画像領域の特定結果も更新される。以下では、ある画像領域について領域情報を更新しないことが確定した場合には、その画像領域を、「最終的に特定された画像領域」、あるいは、「確定した画像領域」とも呼ぶ。
なお、バンド画像BDG1において特定される画像領域A1〜A3は、非均一領域と均一領域とのうちのいずれかである。非均一領域は、非均一ブロックに分類された単位ブロックBによって構成される領域である。均一領域は、均一ブロックに分類された単位ブロックBによって構成される領域である。図4(a)の例では、画像領域A1は、均一領域であり、画像領域A2、A3は、非均一領域である。
図4(a)の例では、バンド画像BDG1の画像領域として、第1の文字オブジェクトOb2の上部分に対応する領域として画像領域A2が特定され、写真オブジェクトOb3の上部分に対応する領域として画像領域A3が特定され、画像領域A2、A3を除く領域(背景画像Bg1の上部分に対応する)画像領域A1が特定されている。
ステップS800の後、ステップS900では、バンド画像処理部M130は、バンド画像BDG1における領域の特定結果を表す領域情報を作成する。本実施例では、バンド画像処理部M130は、領域情報を、画像解析データ294に記録する。図4(d)には、画像解析データ294の一例が示されている。画像解析データ294に記録される項目は、特定された領域を識別する領域識別子と、領域を構成する複数の単位ブロックB(ブロック画素BP)の座標であるブロック座標と、非均一領域および均一領域のいずれかを表す領域種と、領域の属性と、特徴量と、二値データを含んでいる。これらの項目のうち、領域を識別する領域識別子と、ブロック座標とが、領域情報に相当する。図4(d)に示す例では、画像解析データ294に、バンド画像BDG1において特定された画像領域A1〜A3(図4(a))の領域識別子(それぞれ「1」、「2」、「3」)と、画像領域A1〜A3を構成する単位ブロックBのブロック座標が記録されている。
ステップS900の後、ステップS1000では、バンド画像処理部M130は、バンド画像BDG1において特定された非均一領域である画像領域A2、A3の特徴量を算出する。具体的には、バンド画像処理部M130は、画像領域A2、A3をそれぞれ二値化した二値画像データMG(2)、MG(3)を生成する。ここで、二値化とは、領域を構成する複数の画素をオブジェクト画素と背景画素に分類することである。例えば、バンド画像処理部M130は、画像領域A2、A3を構成する複数の画素のうち、これらの領域に隣接する均一領域である画像領域A1の画素の色との差が、所定の基準より小さい画素を背景画素とする。領域区分部M131は、画像領域A2、A3を構成する複数の画素のうち、背景画素を除いた画素を、オブジェクト画素とする。そして、バンド画像処理部M130は、特徴量として、オブジェクト画素数Npと、総画素数Ntと、オブジェクト画素の輝度値の分布状態を表すヒストグラムデータHDとを生成する。以下、領域識別子が「i」である画像領域のオブジェクト画素数Np、総画素数Nt、ヒストグラムデータHDを、それぞれ、Np(i)、Nt(i)、HD(i)とも表す。
ステップS1000の後、ステップS1100では、バンド画像処理部M130は、上述した特徴量Np、Nt、HD、および、二値画像データMGを記述した特徴情報を作成する。本実施例では、バンド画像処理部M130は、特徴情報を、画像解析データ294に記録する。図4(d)に示す例では、画像解析データ294の特徴量の項目に、画像領域A2、A3(図4(a))の特徴量Np(2)、Nt(2)、HD(2)、及び、特徴量Np(3)、Nt(3)、HD(3)が、二値画像データの項目に、画像領域A2、A3の二値画像データMG(2)、MG(3)がそれぞれ記述されている。
ステップS1100の後、ステップS1200では、バンド画像処理部M130は、現在処理中のバンド画像が2つ目以降のバンド画像であるか否かを判断する。バンド画像BDG1は対象画像Gの1つ目のバンド画像であるので、バンド画像BDG1が処理対象である場合には、バンド画像処理部M130は、現在処理中のバンド画像が2つ目以降のバンド画像でないと判断する。一方、バンド画像BDG2〜BDG4(図3)が処理対象である場合には、バンド画像処理部M130は、現在処理中のバンド画像が2つ目以降のバンド画像であると判断する。
現在処理中のバンド画像が2つ目以降のバンド画像である場合には(ステップS1200:YES)、バンド画像処理部M130の領域情報更新部M132と特徴情報更新部M133は、領域結合処理を実行する(ステップS1300)。領域結合処理は、現在処理中のバンド画像において特定された画像領域と、先に処理されたバンド画像において特定された画像領域とを結合する処理である。領域結合処理については後述する。現在処理中のバンド画像が2つ目以降のバンド画像でない場合には(ステップS1200:NO)、バンド画像処理部M130は、処理をステップS1400に移行する。
ステップS1400では、バンド画像処理部M130は、確定した非均一領域があるか否かを判断する。ここで、確定した非均一領域とは、その非均一領域について画像解析データ294における領域情報の更新が行われないことが確定した非均一領域を指す。バンド画像処理部M130は、処理中のバンド画像の下端に接していない非均一領域がある場合に、その非均一領域は、確定した非均一領域であると判断する。処理中のバンド画像の下端に接していない非均一領域は、次に処理されるバンド画像において特定される画像領域と結合されることはないからである。バンド画像処理部M130は、確定した非均一領域がある場合には(ステップS1400:YES)、バンド画像処理部M130の属性判定部M134は、領域属性判定処理を実行する(ステップS1500)。領域属性判定処理については後述する。バンド画像処理部M130は、確定した非均一領域がない場合には(ステップS1400:NO)、バンド画像処理部M130は、処理をステップS1600に移行する。
ステップS1600では、バンド画像処理部M130は、処理対象のバンド画像の下端ラインデータLD1を隣接ライン格納領域243に保存する。図4(e)には、下端ラインデータLD1の一例が示されている。下端ラインデータLD1は、バンド画像の最下端のラスタライン(下端ライン)を構成する各画素のそれぞれについて、画素が属する領域を識別する領域識別子を表すデータである。下端ラインデータLD1は、領域結合処理(ステップS1300)において使用する。
ステップS1600の後、ステップS1700では、バンド画像処理部M130は、全てのバンド画像について処理が終了したか否かを判断する。すなわち、バンド画像処理部M130は、全てのバンド画像について処理が終了していない場合には(ステップS1700:NO)、ステップS400に戻って、未処理のバンド画像を表すバンド画像データを取得し、上述したステップS500〜ステップS1600の処理を繰り返す。例えば、対象画像Gの最初のバンド画像BDG1(図3)を表すバンド画像データについて処理がステップS1600までの終了した後には、対象画像Gの2番目のバンド画像BDG2(図3)を表すバンド画像データについて同様の処理が行われる。新たに取得されたバンド画像データは、処理が終了したバンド画像を表すバンド画像データに上書きされるので、処理が終了したバンド画像を表すバンド画像データは消去される。バンド画像処理部M130は、全てのバンド画像について処理が終了した場合には(ステップS1700:YES)、画像処理を終了する。
以上では、対象画像Gの最初のバンド画像BDG1の処理を例に説明したが、以下では、対象画像Gの2番目のバンド画像BDG2の処理を例に、領域結合処理(ステップS1300)と、領域属性判定処理(ステップS1500)について説明する。
まず、領域統合処理(ステップ1300)について説明する。図5は、領域結合処理について説明する第1の図である。図6は、領域結合処理について説明する第2の図である。図5(a)は、対象画像Gの2番目のバンド画像BDG2を処理対象にして上述したステップS500〜ステップS1100までを実行した時点、すなわち、領域結合処理を実行する前(以下、結合前とも呼ぶ)のブロック画像BG2を示している。この段階では、ブロック画像BG2において、画素値(領域識別子)がそれぞれ4〜8である画像領域BA4〜BA8が特定されている。画像領域BA5は、対象画像Gにおける第1の文字オブジェクトOb2の下部分に対応する領域であり、画像領域BA6は、対象画像Gにおける写真オブジェクトPHの下部分に対応する領域であり、画像領域BA8は、対象画像Gにおける第2の文字オブジェクトOb4の上部分に対応する領域である。画像領域BA4、BA7は、背景画像Bg1に対応する領域である。
図6(a)は、結合前の画像解析データ294を示している。この時点では、最初のバンド画像BDG1において特定された画像領域(領域識別子1〜3)と、2番目のバンド画像BDG2において特定された画像領域(領域識別子4〜8)とが別々の領域として扱われている。また、特徴量Np、Nt、HDや二値画像データMGも各領域で別々に扱われている。
例えば、2番目のバンド画像BDG2を処理対象にしてステップS500〜S1100を終え、ステップS1200の判断を行うと、2番目のバンド画像BDG2が、2つ目以降のバンド画像であると判断されるので(ステップS1200:YES)、ステップS1300の領域結合処理を実行する。図2(b)は、領域結合処理(図2(a):ステップS1300)の処理ステップを表している。図2(b)のステップS1310では、領域情報更新部M132は、ラインデータの組LDを取得する。図5(c)には、本ステップにおいて取得されるラインデータの組LDの一例が示されている。ラインデータの組LDは、隣接ライン格納領域243に格納される。ラインデータの組LDは、1つ前に処理されたバンド画像の下端ラインデータLD1と、現在、処理対象のバンド画像の上端ラインデータLD2とを含む。
下端ラインデータLD1は、上述したように、バンド画像の最下端のラスタライン(下端ライン)を構成する各画素の画素データを含む。下端ラインデータLD1の各画素データは、画素が属する領域を識別する領域識別子である。下端ラインデータLD1は、1つ前に処理されたバンド画像を処理する際に、上述したステップS1600において、隣接ライン格納領域243に格納されている。上端ラインデータLD2は、バンド画像の最上端のラスタライン(上端ライン)を構成する各画素の画素データを含む。上端ラインデータLD2の各画素データは、画素が属する領域を識別する領域識別子である。
図5(c)の例では、対象画像Gの最初のバンド画像BDG1の下端ラインデータLD1と、対象画像Gの2番目のBDG2の上端ラインデータLD2とが示されている。バンド画像の下端ラインは、当該バンド画像の次に処理されるバンド画像と隣接する隣接ラインである。バンド画像の上端ラインは、当該バンド画像の前に処理されたバンド画像と隣接する隣接ラインである。また、バンド画像の下端ラインと、当該バンド画像の次に処理されるバンド画像の上端ラインは、下端ラインを上側とし、上端ラインを下側として、対象画像Gにおいて互いに隣接するラスタラインの組である。下端ラインデータLD1を構成する画素データLP1を上側画素データLP1とも呼び、上端ラインデータLD2に対応するラスタラインを構成する画素データLP2を下側画素データLP2とも呼ぶ(図5(c))。また、上側画素データLP1に対応する画素、すなわち、下端ラインを構成する画素を上側画素とも呼び、下側画素データLP2に対応する画素、すなわち、上端ラインを構成する画素を、下側画素とも呼ぶ。
ステップS1310の後、ステップS1320では、領域情報更新部M132は、上側画素を順次に選択する。選択順は、下端ラインに沿って、一方の端から他方の端に向かう方向である。
ステップS1320の後、ステップS1330では、領域情報更新部M132は、選択した上側画素に隣接する下側画素は、上側画素が属する画像領域と同種の画像領域に属するか否かを判断する。具体的には、領域情報更新部M132は、選択した上側画素の上側画素データLP1(領域識別子)を参照して、当該上側画素が属する画像領域を認識する。さらに、領域情報更新部M132は、選択した上側画素に隣接する下側画素の下側画素データLP2(領域識別子)を参照して、当該下側画素が属する画像領域を認識する。ここで、上側画素に隣接する下側画素は、上側画素の真下に隣接する下側画素のみであっても良いし、上側画素の真下および左下および右下にそれぞれ隣接する3つの下側画素であっても良い。領域情報更新部M132は、画像解析データ294を参照して、上側画素の属する画像領域と、下側画素の属する画像領域とが、両方とも均一領域である場合、および、両方とも非均一領域である場合には、隣接する下側画素は同種の画像領域に属すると判断する。
領域情報更新部M132は、隣接する下側画素が同種の画像領域に属しない場合には(ステップS1330:NO)、ステップ1340〜ステップ1360の処理を省略して、ステップS1370に処理を移行する。領域情報更新部M132は、隣接する下側画素が同種の画像領域に属する場合には(ステップS1330:YES)、選択された上側画素が属する画像領域と、当該上側画素に隣接する下側画素が属する画像領域とを結合して1つの画像領域として特定するように、領域情報を更新する(ステップS1340)。
すなわち、上側画素のうち、均一領域に属する画素を上側均一領域画素とし、下側画素のうち、均一領域に属する画素を下側均一領域画素とすると、領域情報更新部M132は、上側均一領域画素と下側均一領域画素が互いに隣接する場合に、上側均一領域画素が属する均一領域と、下側均一領域画素が属する均一領域とを結合する。また、上側画素のうち、非均一領域に属する画素を上側非均一領域画素とし、下側画素のうち、非均一領域に属する画素を下側非均一領域画素とすると、領域情報更新部M132は、上側非均一領域画素と下側非均一領域画素が互いに隣接する場合に、上側非均一領域画素が属する非均一領域と、下側非均一領域画素が属する非均一領域とを結合する。
ステップS1340の後、ステップS1350では、特徴情報更新部M133は、領域情報の更新に応じて、特徴情報(特徴量Np、Nt、HD、および、二値画像データMG)を更新する。
ステップS1350の後、ステップS1360では、領域情報更新部M132の識別情報更新部M1321は、ラインデータの組LDにおいて、選択された上側画素に隣接する下側画素の領域識別子と同じ識別子を、選択された上側画素の領域識別子と同じ値に全て更新し、ステップS1370に処理を移行する。
ステップS1370では、バンド画像処理部M130は、全ての上側画素を選択したか否かを判断する。バンド画像処理部M130は、全ての上側画素を選択していない場合には(ステップS1370:NO)、ステップS1320に戻って、未選択の上側画素を選択して、上述したステップS1330〜S1370の処理を繰り返す。バンド画像処理部M130は、全ての上側画素が選択済みである場合には(ステップS1370:YES)、領域結合処理を終了する。
領域結合処理の具体例を説明する。図5(b)に示すように、領域結合処理が実行された後(結合後とも呼ぶ。)、ブロック画像BG2では、均一領域である画像領域BA4、BA7(図5(a))が、上側に隣接するブロック画像BG1(図4(c))の均一領域である画像領域BA1と結合される。また、ブロック画像BG2では、非均一領域である画像領域BA5、BA6(図5(a))が、上側に隣接するブロック画像BG1(図4(c))の非均一領域である画像領域BA2、BA3とそれぞれ結合される。このような画像領域の結合は、領域情報更新部M132が、画像解析データ294を、図6(b)に示すように、更新することによって実現される。すなわち、画像解析データ294において、識別子4〜7の画像領域についての情報は削除され、識別子4〜7の画像領域についての情報は結合先である識別子1〜3の画像領域についての情報と統合される。例えば、結合後の識別子「1」の画像領域のブロック座標の情報には、結合前の識別子「4」「7」の画像領域のブロック座標の情報が統合される。また、結合後の識別子「3」の画像領域の特徴量Np、Nt、HDは、結合前の識別子「3」の画像領域の特徴量と結合前の識別子「6」の画像領域の特徴量との和とされる。また、結合後の識別子「3」の画像領域の二値画像データMG(3+6)は、結合前の識別子「3」の画像領域の二値画像データMG(3)と、結合前の識別子「6」の画像領域の二値画像データMG(6)とを統合したデータとされる。
上述したように、領域結合処理において、領域情報更新部M132は、ラインデータの組LDを用いて、互いに隣接する上側画素と下側画素の組を上端ラインおよび下端ラインに沿って順次に処理対象とし、処理対象の組が、上側均一領域画素と下側均一領域画素の組、または、上側非均一領域画素と下側非均一領域画素の組であるか否かを判定している(ステップS1320、ステップS1330)。そして、判定結果が、肯定的である場合に、領域情報更新部M132は、処理対象の組を構成する下側画素の領域識別子を、上側画素の領域識別子と同一するように、ラインデータの組LDを更新している(ステップS1340〜ステップS1360)。この結果、図5(d)に示す例では、上端ラインデータLD2は、下端ラインデータLD1と、完全に同じ値に更新される。
このように、ラインデータの組LDを一端から他端に向かって走査することによって、隣接する画像領域を結合するか否かを適切に判断することができる。図7は、領域結合処理について説明する第3の図である。図7を参照して、より具体的に説明する。図7(a)に示すように、結合前において、ラインデータの組LDより上側のバンド画像(上側バンド画像)において、互いに異なる非均一領域AAと非均一領域ACとが特定されており、ラインデータの組LDより下側のバンド画像(下側バンド画像)において、互いに異なる非均一領域ABと非均一領域ADとが特定されているとする。上側バンド画像の1つの非均一領域ACは、下側バンド画像の複数の非均一領域AB、ADとそれぞれ隣接している。下側バンド画像の1つの非均一領域ABは、上側バンド画像の複数の非均一領域AA、ACとそれぞれ隣接している。
図7において、矢印SPは、ラインデータの組LDにおける走査位置(処理対象の上側画素と下側画素の組の位置)を示している。図7(b)に示す走査位置にて、上側バンド画像の非均一領域AAと下側バンド画像の非均一領域ABとが結合されて、新たな非均一領域AA1(領域識別子は、結合前の非均一領域AAと同じである。)として特定される。さらに、図7(c)に示す走査位置にて、上側バンド画像の非均一領域ACと、非均一領域AA1とが結合されて、新たな非均一領域AC2(領域識別子は、結合前の非均一領域ACと同じである。)として特定される。さらに、図7(d)に示す走査位置にて、非均一領域AC2と、下側バンド画像の非均一領域ADとが結合されて、新たな非均一領域AC3(領域識別子は、結合前の非均一領域ACと同じである。)として特定される。
以上の説明から解るように、ラインデータの組LDを一端から他端に向かって走査することによって、上側バンド画像における1つの画像領域が、下側バンド画像における複数の同種の画像領域とそれぞれ隣接している場合には、下側バンド画像における複数の分離した画像領域を1つの画像領域として特定することができる。逆に、下側バンド画像における1つの画像領域が、上側バンド画像における複数の同種の画像領域とそれぞれ隣接している場合には、上側バンド画像における複数の分離した画像領域を1つの画像領域として特定することができる。この結果、複数のバンド画像に亘る様々な形状の画像領域、例えば、U字型の画像領域、U字を上下反転させた形状の画像領域、O字型の画像領域についても、適切に結合して1つの画像領域として特定することができる。
次に、領域属性判定処理(図2(a):ステップS1500)について説明する。対象画像Gの2番目のバンド画像BDG2(図3)について、ステップS400〜ステップS1300までの処理が終了すると、バンド画像処理部M130は、ステップS1400において、ブロック画像BG2における領域識別子「2」の画像領域BA2(図5(b))は、確定した画像領域であると判断する(S1400:YES)。この結果、対象画像Gにおいて、第1の文字オブジェクトOb2を含む非均一領域である画像領域A2(図3)が確定する。
ステップS1400にてYESと判断した後、ステップS1500では、属性判定部M134は、確定した非均一領域である画像領域A2に対して、属性を判定する領域属性処理を実行する。
図8は、属性判定処理について説明する説明図である。属性判定部M134は、対象領域(この例では、画像領域A2)の画素密度D、分布幅W、色数Sに基づいて、対象領域の属性を判定する。属性判定部M134は、まず、対象領域の特徴量として画像解析データ294に記録されているオブジェクト画素数Npと、総画素数Ntとを用いて、画素密度Dを算出する。画素密度Dは、D=Np/Ntで表され、対象領域に占めるオブジェクト画素の割合を示す値である。
属性判定部M134は、さらに、対象領域の特徴量として画像解析データ294に記録されているヒストグラムデータHDを用いて、分布幅Wと色数Sとを算出する。このヒストグラムデータHDは、各輝度値を有する画素の数を輝度値ごとにカウントしたデータである。図8(a)は、ヒストグラムデータHDを用いて、横軸に輝度値を取り、縦軸に画素数をプロットして得られるヒストグラムを示している。
分布幅Wは、例えば、上述した輝度値のヒストグラムにおいて、基準値Th2よりも多くの画素が有する輝度値のうちの最大値と、基準値Th2よりも多くの画素が有する輝度値Yのうちの最小値との差である(図8(a))。分布幅Wは、輝度値の分布の特徴を表す特徴値であって、輝度値の分布範囲の広さを示す特徴値である。
色数Sは、図8(a)に示すように、本実施例では、基準値Th2より多くの画素が有する輝度値の数である。輝度値が異なれば、その画素の色が異なるので、異なる輝度値の数は、異なる色の数(色の種類の数)を表している。すなわち、色数Sは、異なる輝度値の数を示す特徴値である。
属性判定部M134は、上述した画素密度Dと、分布幅Wと、色数Sとに基づいて、対象領域の属性を判定する。例えば、属性判定部M134は、上述した画素密度D、分布幅W、色数Sのそれぞれが、対応する基準値Dth、Wth、Sth以上であるか否かを判断する。属性判定部M134は、これらの判断結果を用いて、図8(b)に示す判定テーブル292を参照して、対象領域の属性を判定する。本実施例では、対象領域(非均一領域)の属性は、「写真」「文字」「描画」のいずれかに判定される。ここで、描画は、イラスト、表、線図、模様などを含む。
以上の説明から解るように、本画像処理では、バンド画像単位での処理(図2(a):ステップS400〜ステップS1600)が行われる度に、確定した非均一領域があるか否かを判断し(ステップS1400)、確定した非均一領域がある場合には(ステップS1400:YES)、属性判定処理(ステップS1500)が実行される。すなわち、本画像処理では、バンド画像単位での処理において、非均一領域の特定が確定する度に、属性判定処理(ステップS1500)が実行される。
図9は、上述した画像処理の結果を概念的に示す図である。上記画像処理が、対象画像Gについて全て終了すると、すなわち、4つのバンド画像BDG1〜BDG4(図3)まで終了すると、画像解析データ294に、図9に示す内容が記録される。すなわち、対象画像Gにおいて、均一領域である画像領域A1と、非均一領域である画像領域A2〜A5とが最終的に特定される。画像領域A2、A4の属性は「文字」であると判定され、画像領域A3の属性は「写真」であると判定され、画像領域BA5の属性は「描画」であると判定される。この画像処理の後には、例えば、属性が特定された画像領域ごとに、属性に応じた画質調整処理が施される。
以上説明した本実施例の画像処理によれば、対象画像Gを分割した複数のバンド画像BDG1〜BDG4のそれぞれを一単位として処理するので、バッファ領域241の必要な容量を低減することができる。さらに、均一領域同士の隣接、および、非均一領域同士の隣接に応じて、複数の画像領域を1つの領域として特定するように、画像解析データ294における領域情報を更新する。この結果、バンド画像単位で、対象画像を処理するにも拘わらず、最終的に精度良く画像領域を特定することができる。
さらに、本実施例の画像処理では、処理対象のバンド画像の処理において特定された非均一領域の特徴量として、オブジェクト画素数Np、総画素数Nt、ヒストグラムデータHDを算出する。そして、複数のバンド画像間に亘る複数の非均一領域が結合された場合には、これらの特徴量Np、Nt、HDについても統合するので、保持すべき情報量を低減することができる。
図10は、本実施例の効果について説明する図である。図10に示すように、1つの文字CHは、上下に分離した複数の構成要素を含む場合がある。このような文字CHをオブジェクトとして有する画像に対して、バンド画像のバンド幅を、図10に示す幅BW1のように、文字CHの大きさに対して過度に小さい幅に定めると、不具合が生じる可能性が高くなる。すなわち、バンド幅が過度に小さいと、バンド画像に設定される単位ブロックBも小さくならざるを得ないので、文字CHにおける上下に分離した複数の構成要素の間に、均一領域があると判断される場合がある。そうすると、1つの画像領域として特定すべき文字オブジェクトに対応する画像領域が、2つの画像領域に分かれて特定される可能性が高くなる。本実施例の画像処理では、文字サイズCSに基づいて、バンド画像のバンド幅を決定するので、文字オブジェクトの大きさに対して適切なバンド幅(例えば、図10におけるバンド幅W2)を定めることができる。この結果、1つの画像領域として特定すべき文字オブジェクトに対応する画像領域が、2つの画像領域に分かれて特定される可能性を低減することができる。
さらに、図7を参照して説明したように、本実施例の画像処理によれば、上側バンド画像における1つの画像領域が、下側バンド画像における複数の同種の画像領域とそれぞれ隣接している場合には、下側バンド画像における複数の分離した画像領域を1つの画像領域として特定することができる。逆に、下側バンド画像における1つの画像領域が、上側バンド画像における複数の同種の画像領域とそれぞれ隣接している場合には、上側バンド画像における複数の分離した画像領域を1つの画像領域として特定することができる。この結果、複数のバンド画像に亘る様々な形状の画像領域を最終的に1つの画像領域として精度良く特定することができると共に、画像解析データ294(領域情報)の情報量を低減することができる。
また、領域結合処理において、ラインデータの組LDを用いて、1つのバンド画像における領域と、他のバンド画像における領域との隣接関係を判断している。この結果、1つのバンド画像における領域と、他のバンド画像における領域とを結合するか否かを精度良く判断することができる。
具体的には、下端ラインデータLD1を構成する均一領域画素と、上端ラインデータLD2を構成する均一領域画素が互いに隣接する場合に、これらの均一領域画素が属する均一領域を結合すると判断する。また、下端ラインデータLD1を構成する非均一領域画素と、上端ラインデータLD2を構成する非均一領域画素が互いに隣接する場合に、これらの非均一領域画素が属する非均一領域を結合すると判断する。この結果、下端ラインデータLD1を構成する画素と、上端ラインデータLD2を構成する画素との隣接関係に基づいて、結合すべき均一領域の組み合わせ、および、結合すべき非均一領域の組み合わせを正しく決定することができる。
さらに、上記実施例では、ラインデータの組LDにおいて、互いに隣接する上側画素と下側画素の組を順次に処理対象とし、処理対象の組が上述した隣接関係を有するか否かを判断している。そして、処理対象の組が上述した隣接関係を有する場合に、処理対象の組を構成する上側画素および下側画素に付された各領域識別子が同一の領域を識別するように、ラインデータの組LDを更新する。このように、ラインデータの組LDを更新しつつ、結合すべき領域を判断するので、結合すべき均一領域の組み合わせ、および、結合すべき非均一領域の組み合わせを正しく決定することができる。また、ラインデータの組LDは、2本のラスタライン分のデータであるので、過度にバッファ領域241の容量を占領することもない。さらに、このとき、上側画素および下側画素と同一の領域識別子が付されているバンド画像の画像領域を構成する各ブロック画素も、各領域識別子が同一の領域を識別するように更新することができる。
さらに、バンド画像単位で処理する過程において、確定した非均一領域がある場合には、画像解析データ294における特徴情報(特徴量Np、Nt、HD)を用いて、確定した非均一領域の属性を判定する。すなわち、非均一領域が確定する度に、その領域の属性を判定するので、不要となった特徴情報を保持する必要がなくなる。この結果、バッファ領域241の必要な容量を低減することができる。
上記実施例における下端ラインデータLD1に対応するバンド画像の下端ラインは、請求項における第1のラインの例であり、上記実施例における上端ラインデータLD2に対応するバンド画像の上端ラインは、請求項における第2のラインの例である。また、上記実施例における下端ラインデータLD1は、請求項における第1の識別情報の例であり、上記実施例における上端ラインデータLD2は、請求項における第2の識別情報の例である。
B.変形例:
この発明は上記実施例に限られるものではなく、その要旨を逸脱しない範囲において種々の態様において実施することが可能である。
(1)上記実施例では、下端ラインデータLD1を構成する非均一領域画素と、上端ラインデータLD2を構成する非均一領域画素とが互いに隣接する場合に、これらの非均一領域画素が属する非均一領域を結合すると判断している。これに代えて、下端ラインデータLD1を構成する非均一領域のオブジェクト画素と、上端ラインデータLD2を構成する非均一領域のオブジェクト画素とが互いに隣接する場合に、非均一領域のオブジェクト画素が属する非均一領域を結合すると判断しても良い。
図11は、変形例におけるラインデータの組LDaを示す図である。本変形例の下端ラインデータLD1aは、均一領域に属する画素については、実施例と同様に、その画素が属する均一領域の領域識別子を画素値として有している。また、本変形例の下端ラインデータLD1aは、非均一領域に属する画素については、当該画素がオブジェクト画素である場合には、その画素が属する非均一領域の領域識別子を画素値として有し、当該画素が背景画素である場合には、「−1」を画素値として有している。上端ラインデータLD2aについても、同様である。
そして、本変形例では、ラインデータの組LDaにおける上側画素と下側画素の組を一端から他端に向かって、実施例と同様に比較する。そして、一方のバンド画像における非均一領域のオブジェクト画素と、他方のバンド画像における非均一領域のオブジェクト画素とが隣接する場合に、これらのオブジェクト画素が属する非均一領域を結合すると判断する。こうすれば、領域を跨いで連続するオブジェクト画素が存在することを条件にして、隣接する非均一領域を結合するか否かを判断するので、連続するオブジェクト画素で構成されるオブジェクトごとに、それぞれ異なる画像領域を特定することができる。
このように、非均一領域を結合する際の判断基準と、均一領域を結合する際に判断基準は異なっていても良い。また、均一領域を結合する際の判断基準は、単に隣接する場合に全て結合することに限らず、例えば、同一色の均一領域が隣接する場合に結合することとしても良い。一般的に言えば、第1のバンド画像の第1の均一領域と、第2のバンド画像の第2の均一領域とが、第1の隣接関係を有する場合に、第1の均一領域と第2の均一領域とを結合すると判断し、第1のバンド画像の第1の非均一領域と、第2のバンド画像の第2の非均一領域とが、第2の隣接関係を有する場合に、第1の非均一領域と前記第2の非均一領域とを結合すると判断すれば良い。
(2)上記実施例では、バンド幅BWは、解像度Rと、文字サイズCSとを用いて決定されている。これに代えて、他の種類のオブジェクトのサイズ、例えば、描画オブジェクトのサイズ、写真オブジェクトのサイズを用いて、バンド幅BWを決定しても良い。こうすれば、描画オブジェクトや写真オブジェクトに対応する画像領域を適切に特定できるように、適切なバンド幅BWを決定することができる。また、対象画像の大きさ(例えば、上下方向の画素数)の大きさを用いてバンド幅BWを決定しても良い。例えば、対象画像の大きさによって、用いられる文字オブジェクトの大きさを概ね予測することも可能である。一般的に言えば、バンド幅BWは、対象画像、および、対象画像におけるオブジェクト、および、画素、のうち少なくとも1つに関するサイズ情報に基づいて決定されることが好ましい。
(3)上記実施例では、解像度Rと、文字サイズCSとを用いて決定されたバンド幅BWをそのまま用いているが、バッファ領域241の容量に応じて、バンド幅を変化させても良い。例えば、バッファ領域241の容量が少ないために、バンド幅BWのバンド画像を取得できない場合には、バンド幅BWより小さいバンド幅であってバッファ領域241の容量に基づいて取得可能な最大幅のバンド画像を取得することとしても良い。
(4)上記実施例では、対象画像Gにおける画像領域の特定と共に、最終的に特定された画像領域の属性の判定(属性判定処理)も行っているが、属性判定処理は省略して、画像領域の特定だけを行っても良い。この場合には、特徴量の算出を省略しても良い。
(5)上記実施例では、ラインデータの組LDを用いて、複数のバンド画像に跨る領域を結合するか否かを判断しているが、これに代えて、ブロック画素BPの隣接関係を用いて、複数のバンド画像に跨る領域を結合するか否かを判断しても良い。具体的には、1つのバンド画像の下端に位置するブロック画素BPと、該バンド画像の下側に隣接する他のバンド画像の上端に位置するブロック画素BPとを比較して、同種の領域(非均一領域または均一領域)を構成するブロック画素BPが隣接する場合には、隣接するブロック画素BPが属する領域同士を結合しても良い。
(6)上記実施例では、1つのバンド画像における1つの領域が、他のバンド画像における複数の領域とそれぞれ隣接している場合には、他のバンド画像における複数の領域を1つの領域とするように、領域情報を更新している。これに代えて、1つのバンド画像における1つの領域と、他のバンド画像における1つの領域とを結合して1つの領域とし、他のバンド画像における複数の領域は、それぞれ別の領域として特定しても良い。
(7)上記実施例では、複数のバンド画像に跨る複数の領域を結合するために領域情報を更新する際に、ラインデータの組LDにおける領域識別子についても更新しているが、ラインデータの組LDにおける領域識別子は、複数の領域を結合するか否かの判断に用いるのみとして、更新は行わないこととしても良い。
(8)上記実施例では、対象画像(バンド画像)の画像領域のエッジ強度を算出し、エッジ強度が基準値以上である画像領域を非均一領域とし、エッジ強度が基準値未満である画像領域を均一領域としている。これに限らず、エッジ強度以外の評価値であって画像領域の均一性を評価できる評価値を算出し、当該評価値と基準値との比較の結果、所定基準より均一であると判断できる画像領域を均一領域とし、所定基準より均一でないと判断できる画像領域を非均一領域とすれば良い。一般的には、画像領域を構成する複数の画素の各表色値(例えば、RGB値)の間の差が小さいほど、均一な領域であると言うことができる。
(9)画像処理部M100の機能を実現する装置は、複合機200に限らず、様々な装置、例えば、プリンタ、デジタルカメラ、スキャナなどの画像関連機器の内部のコンピュータ、あるいは、汎用のパーソナルコンピュータ、サーバなどの計算機であっても良い。また、1つの筐体の装置に限らず、複数の筐体内にそれぞれ配置された複数の計算機を含む計算機システム(例えば、いわゆるクラウドコンピューティングを実現する分散型の計算機システム)によって、画像処理部M100の機能が実現されても良い。この場合には、画像処理部M100の機能を実現する計算機システムの全体が、請求項における画像処理装置に対応する。
(10)上記実施例において、ハードウェアによって実現されていた構成の一部をソフトウェアに置き換えるようにしてもよく、逆に、ソフトウェアによって実現されていた構成の一部をハードウェアに置き換えるようにしてもよい。
200...複合機、210...CPU、240...内部記憶装置、250...プリンタ部、260...スキャナ部、270...操作部、280...通信部、290...外部記憶装置、291...コンピュータプログラム、292...判定テーブル、M100...画像処理部、M110...バンド幅決定部、M120...画像分割部、M130...バンド画像処理部

Claims (10)

  1. 対象画像データが示す対象画像を、複数のバンド画像に分割する分割部と、
    前記複数のバンド画像を順次に処理して、各バンド画像を、所定基準より均一な領域である均一領域と、前記所定基準より均一でない領域である非均一領域とに区分する区分部と、
    前記対象画像の領域を特定するための領域情報を更新する領域情報更新部であって、先に処理された第1のバンド画像の第1の均一領域と、処理対象である第2のバンド画像の第2の均一領域とが、第1の隣接関係を有する場合に、前記第1の均一領域と前記第2の均一領域と1つの均一領域として特定するように前記領域情報を更新し、前記第1のバンド画像の第1の非均一領域と、前記第2のバンド画像の第2の非均一領域とが、第2の隣接関係を有する場合に、前記第1の非均一領域と前記第2の非均一領域とを1つの非均一領域として特定するように前記領域情報を更新する、前記領域情報更新部と、
    を、備える画像処理装置。
  2. 請求項1に記載の画像処理装置であって、さらに、
    前記領域情報において特定された各領域の属性を判定するための特徴情報を更新する特徴情報更新部を備え、
    前記特徴情報は、前記非均一領域に含まれる各画素に関連する特徴量を含み、
    記第1の非均一領域と前記第2の非均一領域とを1つの非均一領域として特定するように前記領域情報が更新された場合には、前記特徴情報更新部は、前記第1の非均一領域の前記特徴量と前記第2の非均一領域の前記特徴量とを用いて、前記1つの非均一領域の前記特徴量を示すように、前記特徴情報を更新する、画像処理装置。
  3. 請求項に記載の画像処理装置であって、さらに、
    前記第2のバンド画像における前記非均一領域について、前記領域情報を更新しないことが確定した場合には、前記特徴情報を用いて、前記非均一領域の属性を判定する判定部を備える、画像処理装置。

  4. 請求項1ないし請求項3のいずれかに記載の画像処理装置であって、さらに、
    前記対象画像、および、前記対象画像におけるオブジェクト、および、画素、のうち少なくとも1つに関するサイズ情報を取得し、前記サイズ情報に基づいて前記バンド画像のバンド幅を決定する決定部を備える、画像処理装置。
  5. 請求項1ないし請求項のいずれかに記載の画像処理装置であって、
    前記領域情報更新部は、前記第1のバンド画像における1つの領域が、前記第2のバンド画像における複数の領域とそれぞれ隣接している場合には、前記第2のバンド画像における前記複数の領域を1つの領域とするように、前記領域情報を更新する、画像処理装置。
  6. 請求項1ないし請求項のいずれかに記載の画像処理装置であって、
    前記領域情報更新部は、前記第2のバンド画像における1つの領域が、前記第1のバンド画像における複数の領域とそれぞれ隣接している場合には、前記第1のバンド画像における前記複数の領域を1つの領域として特定するように、前記領域情報を更新する、画像処理装置。
  7. 請求項1ないし請求項のいずれかに記載の画像処理装置であって、
    前記領域情報更新部は、前記第1のバンド画像における前記第2のバンド画像との隣接ラインである第1のラインと、前記第2のバンド画像における前記第1のバンド画像との隣接ラインである第2のラインとを用いて、前記第1の隣接関係および前記第2の隣接関係の有無を判断する、画像処理装置。
  8. 請求項に記載の画像処理装置であって、
    前記領域情報更新部は、
    前記第1のラインを構成する複数の第1種の画素のうち、前記第1の均一領域に属する画素を第1種の均一領域画素とし、前記第2のラインを構成する複数の第2種の画素のうち、前記第2の均一領域に属する画素を第2種の均一領域画素とするとき、前記第1種の均一領域画素と前記第2種の均一領域画素が互いに隣接する場合に、前記第1の均一領域と前記第2の均一領域とが前記第1の隣接関係を有すると判断し、
    前記複数の第1種の画素のうち、前記第1の非均一領域に属する画素を第1種の非均一領域画素とし、前記複数の第2種の画素のうち、前記第2の非均一領域に属する画素を第2種の非均一領域画素とするとき、前記第1種の非均一領域画素と前記第2種の非均一領域画素が互いに隣接する場合に、前記第1の非均一領域と前記第2の非均一領域とが前記第2の隣接関係を有すると判断する、画像処理装置。
  9. 請求項に記載の画像処理装置であって、さらに、
    前記複数の第1種の画素のうち、少なくとも前記第1種の均一領域画素および前記第1種の非均一領域画素を含む複数の画素のそれぞれについて、画素が属する領域を識別する第1の識別情報と、前記複数の第2種の画素のうち、少なくとも前記第2種の均一領域画素および前記第2種の非均一領域画素を含む複数の画素のそれぞれについて、画素が属する領域を識別する第2の識別情報と、を格納する格納部を備え、
    前記領域情報更新部は、互いに隣接する前記第1種の画素と前記第2種の画素の組を前記第1のラインに沿って順次に処理対象とし、処理対象の組が第1種の均一領域画素と第2種の均一領域画素の組または第1種の非均一領域画素と第2種の非均一領域画素の組である場合に、前記処理対象の組を構成する各画素に付された各領域識別子が同一の領域を識別するように、前記第1の識別情報および前記第2の識別情報を更新する、識別情報更新部を有し、
    前記領域情報更新部は、前記第1の識別情報および前記第2の識別情報を更新しつつ、前記領域情報を更新する、画像処理装置。
  10. 対象画像データが示す対象画像を、複数のバンド画像に分割する分割機能と、
    前記複数のバンド画像を順次に処理して、各バンド画像を、所定基準より均一な領域である均一領域と、前記所定基準より均一でない領域である非均一領域とに区分する区分機能と、
    前記対象画像の領域を特定するための領域情報を更新する領域情報更新機能であって、先に処理された第1のバンド画像の第1の均一領域と、処理対象である第2のバンド画像の第2の均一領域とが、第1の隣接関係を有する場合に、前記第1の均一領域と前記第2の均一領域と1つの均一領域として特定するように前記領域情報を更新し、前記第1のバンド画像の第1の非均一領域と、前記第2のバンド画像の第2の非均一領域とが、第2の隣接関係を有する場合に、前記第1の非均一領域と前記第2の非均一領域とを1つの非均一領域として特定するように前記領域情報を更新する、前記領域情報更新機能と、
    を、コンピュータに実現させるコンピュータプログラム。
JP2011167178A 2011-07-29 2011-07-29 画像処理装置、および、コンピュータプラグラム Active JP5796392B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2011167178A JP5796392B2 (ja) 2011-07-29 2011-07-29 画像処理装置、および、コンピュータプラグラム
EP12178349.2A EP2551824B1 (en) 2011-07-29 2012-07-27 Image processing device for accurately identifying region in image without increase in memory requirement
US13/562,212 US8830529B2 (en) 2011-07-29 2012-07-30 Image processing device for accurately identifying region in image without increase in memory requirement

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011167178A JP5796392B2 (ja) 2011-07-29 2011-07-29 画像処理装置、および、コンピュータプラグラム

Publications (2)

Publication Number Publication Date
JP2013031106A JP2013031106A (ja) 2013-02-07
JP5796392B2 true JP5796392B2 (ja) 2015-10-21

Family

ID=46690390

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011167178A Active JP5796392B2 (ja) 2011-07-29 2011-07-29 画像処理装置、および、コンピュータプラグラム

Country Status (3)

Country Link
US (1) US8830529B2 (ja)
EP (1) EP2551824B1 (ja)
JP (1) JP5796392B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5842441B2 (ja) 2011-07-29 2016-01-13 ブラザー工業株式会社 画像処理装置およびプログラム
JP5776419B2 (ja) 2011-07-29 2015-09-09 ブラザー工業株式会社 画像処理装置、画像処理プラグラム
JP5853470B2 (ja) 2011-07-29 2016-02-09 ブラザー工業株式会社 画像処理装置、画像処理プラグラム
JP6165513B2 (ja) * 2013-06-14 2017-07-19 国立大学法人埼玉大学 ハンドジェスチャトラッキングシステム
CN114237527B (zh) * 2021-12-21 2022-06-24 北京博示电子科技有限责任公司 一种打印方法、装置、电子设备及计算机可读存储介质

Family Cites Families (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0656618B2 (ja) 1986-05-20 1994-07-27 国際電信電話株式会社 画像情報の文字・図形分離方法
IL98293A (en) 1991-05-28 1994-04-12 Scitex Corp Ltd A method for distinguishing between text and graphics
JPH05225378A (ja) * 1991-06-03 1993-09-03 Fujitsu Ltd 文書画像の領域分割システム
JP3058489B2 (ja) 1991-09-20 2000-07-04 シャープ株式会社 文字列抽出方法
JPH06208625A (ja) 1993-01-11 1994-07-26 Canon Inc 画像処理方法及び装置
EP0587450B1 (en) 1992-09-11 2004-11-17 Canon Kabushiki Kaisha Image processing method and apparatus
US5991515A (en) * 1992-11-10 1999-11-23 Adobe Systems Incorporated Method and apparatus for compressing and decompressing data prior to display
JP2871601B2 (ja) 1995-08-15 1999-03-17 日本電気株式会社 文字列検出装置及び方法
US7164493B1 (en) 1998-11-06 2007-01-16 Canon Kabushiki Kaisha Image processing method, system and apparatus, and storage medium
DE69937871T2 (de) * 1998-12-02 2008-12-24 Xerox Corp. Verfahren und Vorrichtung zur Bildsegmentierung
US6643400B1 (en) 1999-03-31 2003-11-04 Minolta Co., Ltd. Image processing apparatus and method for recognizing specific pattern and recording medium having image processing program recorded thereon
JP3918381B2 (ja) 1999-10-25 2007-05-23 富士ゼロックス株式会社 画像処理装置および画像処理方法
JP2001218028A (ja) * 2000-01-31 2001-08-10 Canon Inc 画像処理装置、画像処理方法及び記憶媒体
JP2002176564A (ja) 2000-12-07 2002-06-21 Canon Inc 画像読取装置及びその制御方法
KR20040069865A (ko) 2003-01-30 2004-08-06 삼성전자주식회사 영상화면 내의 글자영역 확장장치 및 방법
JP4383157B2 (ja) 2003-05-15 2009-12-16 株式会社リコー 画像処理装置、プログラム及び記憶媒体
US8520093B2 (en) 2003-08-05 2013-08-27 DigitalOptics Corporation Europe Limited Face tracker and partial face tracker for red-eye filter method and apparatus
DE10352341A1 (de) 2003-11-06 2005-11-03 Mediacare Gmbh & Co. Kg Verfahren zur Veränderung der Abmessungen eines elektronisch gespeicherten Bildes
EP1555804A3 (en) 2004-01-19 2006-08-16 Ricoh Company, Ltd. Image processing apparatus, image processing program and storage medium
US7343046B2 (en) 2004-02-12 2008-03-11 Xerox Corporation Systems and methods for organizing image data into regions
JP4617730B2 (ja) 2004-06-15 2011-01-26 ソニー株式会社 画像処理装置および方法、記録媒体、並びにプログラム
JP2006085665A (ja) 2004-08-18 2006-03-30 Ricoh Co Ltd 画像処理装置、画像処理プログラム、記憶媒体、画像処理方法および画像形成装置
KR100643759B1 (ko) 2004-12-01 2006-11-10 삼성전자주식회사 문서 압축 장치 및 그 방법
JP4641414B2 (ja) 2004-12-07 2011-03-02 キヤノン株式会社 文書画像検索装置、文書画像検索方法、プログラム、記憶媒体
KR100926193B1 (ko) * 2004-12-21 2009-11-09 캐논 가부시끼가이샤 디지털 화상 분할 및 콤팩트한 표현 생성
JP4483567B2 (ja) * 2004-12-21 2010-06-16 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、画像処理方法および画像処理プログラム
JP4137890B2 (ja) 2005-01-21 2008-08-20 シャープ株式会社 画像処理装置、画像形成装置、画像読取処理装置、画像処理方法、画像処理プログラムおよびコンピュータ読み取り可能な記録媒体
JP2006251902A (ja) 2005-03-08 2006-09-21 Fuji Xerox Co Ltd 翻訳文書画像生成装置、翻訳文書画像生成プログラム及び翻訳文書画像生成方法
US20060274376A1 (en) * 2005-06-06 2006-12-07 Lexmark International, Inc. Method for image background detection and removal
US20070236707A1 (en) 2006-04-06 2007-10-11 Kabushiki Kaisha Toshiba Image processing apparatus, image processing method and image processing program
JP2007310775A (ja) 2006-05-22 2007-11-29 Murata Mach Ltd 画像処理装置及び画像処理方法
JP4829835B2 (ja) 2006-06-12 2011-12-07 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム、及びコンピュータ読み取り可能な記憶媒体
JP4135752B2 (ja) 2006-06-12 2008-08-20 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、画像処理方法及び画像処理プログラム
CN101123682B (zh) * 2006-08-11 2011-06-22 松下电器产业株式会社 可减少图像振铃噪声的方法、装置及集成电路
US7865032B2 (en) 2006-09-22 2011-01-04 Hewlett-Packard Development Company, L.P. Methods and systems for identifying an ill-exposed image
JP4240107B2 (ja) 2006-10-27 2009-03-18 コニカミノルタビジネステクノロジーズ株式会社 領域判定方法、領域判定装置、画像処理装置、およびコンピュータプログラム
US7840071B2 (en) * 2006-12-12 2010-11-23 Seiko Epson Corporation Method and apparatus for identifying regions of different content in an image
JP4821663B2 (ja) 2007-03-12 2011-11-24 日本電気株式会社 文字ノイズ除去装置、文字ノイズ除去方法、文字ノイズ除去プログラム
JP2008282095A (ja) 2007-05-08 2008-11-20 Canon Inc OCR(OpticalCharacterRecognize)ソフトウエア
JP5165443B2 (ja) 2007-06-14 2013-03-21 株式会社フジクラ 石英系マルチコア光ファイバ
CN101436248B (zh) 2007-11-14 2012-10-24 佳能株式会社 用于根据图像生成文本字符串的方法和设备
US8532374B2 (en) * 2007-12-05 2013-09-10 Canon Kabushiki Kaisha Colour document layout analysis with multi-level decomposition
JP5028337B2 (ja) * 2008-05-30 2012-09-19 キヤノン株式会社 画像処理装置、画像処理方法、プログラム、及び記憶媒体
JP4929237B2 (ja) * 2008-06-23 2012-05-09 キヤノン株式会社 画像処理装置及び画像処理方法
US8320674B2 (en) 2008-09-03 2012-11-27 Sony Corporation Text localization for image and video OCR
US8285035B2 (en) 2008-12-05 2012-10-09 Xerox Corporation 3+1 layer mixed raster content (MRC) images having a text layer and processing thereof
KR101566196B1 (ko) * 2009-03-02 2015-11-05 삼성전자주식회사 히스토그램 분석을 이용한 영상 분류 방법 및 장치, 이를 이용한 문자 인식 방법 및 장치
JP5312166B2 (ja) 2009-04-13 2013-10-09 キヤノン株式会社 画像処理装置及び制御方法及びプログラム
JP2010252194A (ja) 2009-04-17 2010-11-04 Canon Inc 画像処理装置及び画像処理方法
US8254694B2 (en) 2009-06-08 2012-08-28 Xerox Corporation Thin line detection in scanned image data
US7844118B1 (en) 2009-07-01 2010-11-30 Xerox Corporation Image segmentation system and method with improved thin line detection
US8335379B2 (en) 2009-12-28 2012-12-18 Xerox Corporation System and method for cleanup of MRC images for improved compression and image quality
JP5526874B2 (ja) 2010-03-09 2014-06-18 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP5733907B2 (ja) 2010-04-07 2015-06-10 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
JP5220828B2 (ja) 2010-11-11 2013-06-26 シャープ株式会社 画像処理装置、画像形成装置、画像読取装置、画像処理方法、プログラム及び記録媒体
JP5853470B2 (ja) 2011-07-29 2016-02-09 ブラザー工業株式会社 画像処理装置、画像処理プラグラム
JP5776419B2 (ja) 2011-07-29 2015-09-09 ブラザー工業株式会社 画像処理装置、画像処理プラグラム
JP5842441B2 (ja) 2011-07-29 2016-01-13 ブラザー工業株式会社 画像処理装置およびプログラム
JP6157138B2 (ja) 2012-03-30 2017-07-05 キヤノン株式会社 画像処理装置

Also Published As

Publication number Publication date
EP2551824A2 (en) 2013-01-30
US20130027732A1 (en) 2013-01-31
EP2551824B1 (en) 2023-08-09
JP2013031106A (ja) 2013-02-07
US8830529B2 (en) 2014-09-09
EP2551824A3 (en) 2017-12-20

Similar Documents

Publication Publication Date Title
JP5776419B2 (ja) 画像処理装置、画像処理プラグラム
JP5958023B2 (ja) 画像処理装置および画像処理プログラム
JP5935454B2 (ja) 画像処理装置および画像処理プログラム
JP4960897B2 (ja) 画像処理装置、画像処理方法、プログラム、記憶媒体
US8319987B2 (en) Image processing apparatus and control method for compressing image data by determining common images amongst a plurality of page images
JP5796392B2 (ja) 画像処理装置、および、コンピュータプラグラム
US10332262B2 (en) Removal of background information from digital images
JP5853470B2 (ja) 画像処理装置、画像処理プラグラム
JP6098298B2 (ja) 画像処理装置およびコンピュータプログラム
JP5939154B2 (ja) 画像処理装置およびコンピュータプログラム
US9253368B2 (en) Image processing device setting binary value without using dither matrix when prescribed condition is satisfied
JP5842441B2 (ja) 画像処理装置およびプログラム
JP5028370B2 (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
JP6031921B2 (ja) 画像処理装置およびプログラム
US9277074B2 (en) Image processing apparatus, method, and medium determining whether image data of a page to be processed is blank and contains a foreground object and transmitting the foreground object obtained by removing a background object
JP2009301090A (ja) 画像処理装置および画像処理プログラム
JP6024795B2 (ja) 画像処理装置、画像処理プラグラム
US9070011B2 (en) Automated segmentation tuner
US20120194883A1 (en) Character detection apparatus, character detection method, and computer-readable storage medium
JP5949399B2 (ja) 画像処理装置およびプログラム
US9098768B2 (en) Character detection apparatus, character detection method, and computer-readable storage medium
JP5884605B2 (ja) 画像処理装置およびプログラム
JP7205689B2 (ja) 画像処理装置、および、コンピュータプログラム
JP4584805B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
WO2020166596A1 (ja) 画像処理システム及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140523

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150223

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150310

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150327

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150721

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150803

R150 Certificate of patent or registration of utility model

Ref document number: 5796392

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150