JP5720154B2 - 画像処理装置及び画像処理プログラム - Google Patents

画像処理装置及び画像処理プログラム Download PDF

Info

Publication number
JP5720154B2
JP5720154B2 JP2010202224A JP2010202224A JP5720154B2 JP 5720154 B2 JP5720154 B2 JP 5720154B2 JP 2010202224 A JP2010202224 A JP 2010202224A JP 2010202224 A JP2010202224 A JP 2010202224A JP 5720154 B2 JP5720154 B2 JP 5720154B2
Authority
JP
Japan
Prior art keywords
unit
image
ruled line
partial image
setting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010202224A
Other languages
English (en)
Other versions
JP2012060465A (ja
Inventor
俊之 山田
俊之 山田
土渕 清隆
清隆 土渕
清水 淳一
淳一 清水
稔 袖浦
稔 袖浦
真人 齊藤
真人 齊藤
新名 博
博 新名
臻瑞 張
臻瑞 張
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2010202224A priority Critical patent/JP5720154B2/ja
Priority to US13/011,486 priority patent/US8494266B2/en
Priority to CN201110053762.4A priority patent/CN102404472B/zh
Publication of JP2012060465A publication Critical patent/JP2012060465A/ja
Application granted granted Critical
Publication of JP5720154B2 publication Critical patent/JP5720154B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40062Discrimination between different image types, e.g. two-tone, continuous tone
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • H04N1/00413Display of information to the user, e.g. menus using menus, i.e. presenting the user with a plurality of selectable options
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00482Output means outputting a plurality of job set-up options, e.g. number of copies, paper size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0094Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Processing (AREA)
  • Character Input (AREA)

Description

本発明は、画像処理装置及び画像処理プログラムに関する。
特許文献1には、複数の色により構成されるビットマップ画像をベクトルデータに変換する画像処理装置であって、ユーザーの指示に基づいて、ユーザー所望の色を選択する選択手段と、前記ビットマップ画像から、前記選択された各色に対応する部分画像を抽出する抽出手段と、前記抽出した部分画像を各色のオブジェクト毎のベクトルデータに変換して記憶手段に記憶するベクトル化手段と、前記変換された各色のオブジェクト毎のベクトルデータを、ユーザ所望の処理対象ベクトルデータとするように制御する制御手段とを備えることを特徴とする画像処理装置が開示されている。
特開2005−197691号公報
本発明は、誤分離しやすい特定種類の部分画像であると判定しやすくするか否かを設定できない場合と比較して、特定種類の部分画像の誤分離を抑制することができる画像処理装置及び画像処理プログラムを提供することを目的とする。
上記目的を達成するために、請求項1記載の発明の画像処理装置は、複数種類の部分画像を含む画像を、予め定めた誤分離しやすい特定種類以外の種類の部分画像に分離する分離手段と、前記分離手段により分離した部分画像のうち、予め定めた二種類の部分画像が、前記特定種類の部分画像であると判定しやすくするか否かを設定する設定手段と、前記設定手段による設定に基づいて、前記予め定めた二種類の部分画像のうち少なくとも一方の部分画像が、前記特定種類の部分画像であるか否かを判定する判定手段と、を備え、前記二種類の部分画像は、線で構成された線画部分画像及び図形で構成された図形部分画像であると共に、前記特定種類の部分画像は、表で構成された表部分画像であり、前記判定手段は、受け付けた前記線画部分画像及び前記図形部分画像に含まれる罫線を抽出する罫線抽出手段と、前記罫線抽出手段の罫線抽出結果に基づいて、前記線画部分画像及び前記図形部分画像が表部分画像であるか否かを判定する表判定手段と、前記線画部分画像を予め定めた第1の収縮膨張画素数で収縮膨張する第1の収縮膨張手段と、前記第1の収縮膨張手段により収縮膨張処理された前記線画部分画像の濃度が、前記設定手段による設定に応じて定められた閾値以上の場合に、前記線画部分画像を前記罫線抽出手段へ出力する第1の濃度判定手段と、前記図形部分画像を前記第1の収縮膨張画素数より大きい第2の収縮膨張画素数で収縮膨張処理する第2の収縮膨張手段と、前記第2の収縮膨張手段により収縮膨張処理された前記図形部分画像の濃度が、前記設定手段による設定に応じて定められた閾値以上の場合に、前記図形部分画像を前記罫線抽出手段へ出力する第2の濃度判定手段と、を含む
請求項2記載の発明の画像処理プログラムは、コンピュータを、請求項1に記載の画像処理装置を構成する各手段として機能させるための画像処理プログラムである。
請求項1記載の発明によれば、誤分離しやすい表部分画像であると判定しやすくするか否かを設定できない場合と比較して、表部分画像の誤分離を抑制することができる、という効果を有する。
請求項記載の発明によれば、誤分離しやすい特定種類の部分画像であると判定しやすくするか否かを設定できない場合と比較して、特定種類の部分画像の誤分離を抑制することができる、という効果を有する。
画像形成装置の概略ブロック図である。 オブジェクト分離部の機能ブロック図である。 第1実施形態に係るオブジェクト分離処理部の機能ブロック図である。 第1実施形態に係る表判定パラメータの一例を示す図である。 メニュー画面の一例を示す図である。 箱表の一例を示す図である。 表の一例を示す図である。 オブジェクト分離部で実行される処理のフローチャートである。 第2実施形態に係るオブジェクト分離処理部の機能ブロック図である。 メニュー画面の一例を示す図である。 表判定パラメータの一例を示す図である。 第3実施形態に係るオブジェクト分離処理部の機能ブロック図である。 罫線抽出パラメータの一例を示す図である。 第4実施形態に係るオブジェクト分離処理部の機能ブロック図である。 濃度判定部で濃度判定に用いられる閾値の一例である。
(第1実施形態)
以下、本発明の第1実施形態について説明する。
図1には、画像形成装置12の概略構成を例示した。同図に示すように、画像形成装置12は、コンピュータ18を含んで構成されている。
コンピュータ18は、CPU(Central Processing Unit)18A、ROM(Read Only Memory)18B、RAM(Random Access Memory)18C、不揮発性メモリ18D、及び入出力インターフェース(I/O)18Eがバス18Fを介して各々接続された構成となっている。
I/O18Eには、操作表示部20、画像読取部22、画像形成部24、用紙供給部26、用紙排出部28、ネットワーク通信インターフェース(I/F)30、電話回線インターフェース(I/F)32、及びハードディスク34等の各機能部が接続されている。
操作表示部20は、例えばコピー開始等を指示するためのスタートボタンやテンキー等の各種ボタン、コピー濃度等の各種の画像形成条件を設定するための設定画面や装置の状態等の各種画面を表示するためのタッチパネル等を含んで構成される。
画像読取部22は、ラインCCD等の画像読取センサや当該画像読取センサを走査するための走査機構等を含んで構成され、装置にセットされた原稿の画像を読み取る。
画像形成部24は、例えば所謂電子写真方式により記録媒体上に画像を形成するものである。具体的には、画像形成部24は、感光体ドラムを帯電するための帯電装置、帯電された感光体ドラム上を画像に応じた光で露光することにより感光体ドラム上に画像に応じた静電潜像を形成する露光装置、感光体ドラム上に形成された静電潜像をトナー現像する現像装置、感光体ドラム上に形成された画像に応じたトナー像を記録媒体に転写する転写装置、記録媒体に転写された画像に応じたトナー像を定着する定着装置等を含んで構成される。
なお、露光装置としては、半導体レーザや回転多面鏡、コリメータレンズやシリンドリカルレンズ、fθレンズ等の光学系を含んで構成された光走査装置、複数のLEDから成るLEDヘッド等がある。
用紙供給部26は、記録用紙が収容される用紙収容部や、用紙収容部から画像形成部24へ記録用紙を供給する供給機構等を含んで構成される。
用紙排出部28は、記録用紙が排出される排出部や、画像形成部24で画像が形成された記録用紙を排出部上に排出させるための排出機構等を含んで構成される。
ネットワーク通信I/F30は、ネットワーク16を介して外部サーバ14とデータ通信を行うためのインターフェースである。
電話回線通信I/F32は、図示しない電話回線を介して接続された他の画像形成装置とファクシミリ通信を行うためのインターフェースである。
ハードディスク34は、例えば装置の各部の状態や稼働状況等のログデータ、コピーやファクシミリ通信、プリント等の処理結果のログデータ、画像読取部22で読み取られた画像の画像データ、各種の設定データ、処理プログラム等が記憶される。
また、コンピュータ18は、画像読取部22で読み取られた画像等のハードディスク34に記憶された画像を読み出して、読み出した画像データに基づいて、画像に含まれる各種オブジェクト(部分画像)を分離するオブジェクト分離部18Aとしての機能を含んでいる。なお、オブジェクトの種類としては、例えば表オブジェクト、CG(コンピュータ・グラフィックス)オブジェクト、線画オブジェクト、写真オブジェクト、文字オブジェクト等がある。
コンピュータ18のCPU18Aが、ハードディスク34に記憶されたオブジェクト分離処理プログラムを読み込んで実行することにより、コンピュータ18は、オブジェクト分離部18として機能する。なお、オブジェクト分離処理プログラムは、CD−ROM等の記録媒体によって提供するようにしてもよい。
図2には、オブジェクト分離部18の機能ブロック図を示した。同図に示すように、オブジェクト分離部18は、JPEGデコーダー部40、オブジェクト分離前処理部42、オブジェクト分離処理部44、罫線補正処理部46、表描画処理部48、CGオブジェクト描画処理部50、写真オブジェクト処理部52、文字描画処理部54、OCR部56、描画データマージ処理部58、及びフォーマット生成部60を含んで構成されている。
JPEGデコーダー部40は、ハードディスク34から読み出された画像であって、例えばJPEG圧縮された画像を、非圧縮画像にデコードし、デコードした画像データをオブジェクト分離前処理部42に出力する。
オブジェクト分離前処理部42は、JPEGデコーダー部40でデコードされた非圧縮画像の画像データ(例えばビットマップ等)に対して予め定めたフィルタ処理や階調補正処理等の各種前処理を施し、その画像データをオブジェクト分離処理部44に出力する。
オブジェクト分離処理部44は、詳細は後述するが、オブジェクト分離前処理部42で処理された画像データに基づいて、その画像に含まれる表オブジェクト、CGオブジェクト、線画オブジェクト、写真オブジェクト、文字オブジェクトを分離する。そして、表オブジェクトのオブジェクトデータは罫線補正処理部46へ出力し、CGオブジェクト及び線画オブジェクトのオブジェクトデータはCGオブジェクト描画処理部50へ出力し、写真オブジェクトのオブジェクトデータは写真オブジェクト描画処理部52へ出力し、文字オブジェクトのオブジェクトデータは文字描画処理部54へ出力する。
罫線補正処理部46では、表オブジェクトデータに対して予め定めた罫線補正処理を施し、表描画処理部48へ出力する。
罫線補正処理としては、例えば表オブジェクト内の点線を実線化する処理がある。具体的には、表オブジェクト内の一定の間隔でオンオフを繰り返している線が存在するか否か、すなわち一定の間隔でオン画素(描画する画素)とオフ画素(描画しない画素)が繰り返されているか否かを判定し、一定の間隔でオン画素とオフ画素が繰り返されている場合には、オフ画素をオン画素に置き換える。これにより、点線が実線化される。
また、その他にも、罫線と文字が接している場合に、それらを分離する処理等があるが、これらの処理に限られるものではない。
表描画処理部48は、入力された表オブジェクトデータをラスタライズして層データを生成し、各層の層データについて実際のオブジェクトデータを生成して描画データマージ部58へ出力する。
CGオブジェクト描画処理部50、写真オブジェクト描画処理部52、及び文字描画処理部54は、表描画処理部48と同様の処理を入力されたオブジェクトデータに対して施し、描画データマージ部58へ出力する。
また、文字描画処理部54は、描画処理したデータをOCR部56にも出力する。OCR部56は、入力されたデータに対してOCR(Optical Character Recognition)処理、すなわち文字認識処理を施し、文字認識結果としての文字データを描画データマージ部58へ出力する。
描画データマージ処理部58は、表描画処理部48、CGオブジェクト描画処理部50、写真オブジェクト描画処理部52、文字描画処理部54、及びOCR部56から出力された描画データやOCRデータをマージする。
フォーマット生成部60は、描画データマージ処理部58でマージされたデータに基づいて、ヘッダ情報を生成し、マージしたデータ及びへッダ情報を予め定めたフォーマットの一つのファイルにまとめる。ヘッダ情報は、例えばマージしたデータから所望のオブジェクトデータを取り出すための情報、すなわち、マージしたデータに含まれる各オブジェクトデータのポインタ(アドレス)等の情報が含まれる。
次に、オブジェクト分離処理部44について説明する。
図3には、オブジェクト分離処理部44の機能ブロック図を示した。同図に示すように、オブジェクト分離処理部44は、連続画素グルーピング部62、文字分離部64、属性分離部66、CG入力制御部68、罫線抽出部70、表判定部72、及び箱表判定部74を含んで構成されている。
連続画素グルーピング部62は、オブジェクト分離前処理部42から入力された画像データを走査し、連続する同じ色の画素群を抽出し、この画素群をひとかたまりのオブジェクトとしてIDを付与する。
文字分離部64は、IDが付与された各々の画素群の特徴から文字と判断される画素群を文字オブジェクト、それ以外の画素群を文字以外のオブジェクトとして分離する。この文字の分離処理は、種々公知の処理を用いることができる。文字以外のオブジェクトのオブジェクトデータは、属性分離部66へ出力される。
属性分離部66は、文字以外のオブジェクトが、線画オブジェクト、CGオブジェクト、写真オブジェクトの何れであるかを判別し、属性を付与する。これにより、文字以外のオブジェクトに属性が付与され、画像データが、線画オブジェクト、CGオブジェクト、写真オブジェクトに分離される。
線画オブジェクトのオブジェクトデータは、罫線抽出部70に出力され、CGオブジェクトのオブジェクトデータは、CG入力制御部68に出力される。
罫線抽出部70は、縦、横に連続する画素、すなわち直線があるか否かを抽出し、その結果を罫線抽出結果としてオブジェクトデータと共に表判定部72に出力する。
表判定部72は、罫線抽出部70で抽出された罫線の罫線抽出結果及び図4に示すような表判定パラメータ76に基づいて、表か否かを判断する。この判断は、例えば図5に示すような操作表示部20に表示されたメニュー画面78において、表認識処理の設定項目のうち、「表より」ボタン80が押下された場合、「CGより」ボタン82が押下された場合によって処理が異なる。
なお、「表より」ボタン80は、読み取り対象の原稿を読み取ってオブジェクト分離する際に、原稿中の表オブジェクトが表オブジェクトとしてより認識されやすくなるようにしたい場合に押下するボタンである。
また、「CGより」ボタン82は、読み取り対象の原稿を読み取ってオブジェクト分離する際に、原稿中のCGオブジェクトがCGオブジェクトとしてより認識されやすくなるようにしたい場合に押下するボタンである。
従って、「表より」ボタン80が押下された場合には、「CGより」ボタン82が押下された場合よりも、CGオブジェクトがよりCGオブジェクトとして認識されやすくなり、CGオブジェクトが他の種類のオブジェクトとして認識されてしまうのが抑制される。
また、「CGより」ボタン82が押下された場合には、「表より」ボタン80が押下された場合よりも、表オブジェクトがより表オブジェクトとして認識されやすくなり、表オブジェクトが他の種類のオブジェクトとして認識されてしまうのが抑制される。
これらのボタンのうち、どのボタンが押下されたかを示す情報は、表判定部72に入力される。
そして、表判定部72は、例えば、図4に示すような、表認識処理の設定毎に予め定められた表判定パラメータ76に基づいて、表オブジェクトか否かを判定する。
図4では、表判定パラメータの一例として、「罫線本数」、「罫線の接続点数」、「罫線の交点数」、「罫線の直線性」が挙げられているが、これらに限られるものではない。
図4に示すように、各表判定パラメータは、「表より」ボタン80が押下された場合、「CGより」ボタン82が押下された場合とで、それぞれ異なる設定値(閾値)a1〜a4、c1〜c4が設定されている。これらの設定値は、「表より」ボタン80が押下された場合には、入力されたオブジェクトが表オブジェクトと判定されやすくなるように、「CGより」ボタン82が押下された場合には、入力されたオブジェクトがCGオブジェクトと判定されやすくなるように、それぞれ設定される。
本実施形態では、一例として、各設定値の大小関係は、a1<c1、a2<c2、a3<c3、a4>c4となっている。
例えば、表判定部72では、「罫線本数」について図4に示すように設定値a1、c1が設定されている場合、罫線抽出部70で抽出された罫線の本数を求め、求めた罫線本数と、図5に示すメニュー画面78からユーザーにより設定された表認識処理の設定に対応した設定値a1又はc1とを比較し、求めた罫線本数が設定値以上であれば表オブジェクトであると判断する。
また、表判定部72は、「罫線の接続点数」について図4に示すように設定値a2、c2が設定されている場合には、罫線抽出部70で抽出された罫線の接続点数を求め、求めた罫線の接続点数と、ユーザーにより設定された表認識処理の設定に対応した設定値a2又はc2とを比較し、求めた罫線の接続点数が設定値以上であれば表オブジェクトであると判断する。
また、表判定部72は、「罫線の交点数」について図4に示すように設定値a3、c3が設定されている場合には、罫線抽出部70で抽出された罫線の交点数を求め、求めた罫線の交点数と、ユーザーにより設定された表認識処理の設定に対応した設定値a3又はc3とを比較し、求めた罫線の交点数が設定値以上であれば表オブジェクトであると判断する。
また、表判定部72は、「罫線の直線性」について図4に示すように設定値a4、c4が設定されている場合には、罫線抽出部70で抽出された罫線の幅の分散値や、罫線の幅の最大値と最小値との差等を罫線の直線性を示すパラメータとして求め、求めた罫線の直線性を示すパラメータと、ユーザーにより設定された表認識処理の設定に対応した設定値a4又はc4とを比較し、求めた罫線の直線性を示すパラメータが設定値以下であれば表オブジェクトであると判断する。
表判定部72は、上記の表判定パラメータの各々について設定値と比較し、その比較結果の各々に基づいて、入力された線画オブジェクト又はCGオブジェクトが表オブジェクトであるか否かを最終的に判定する。例えば、各表判定パラメータの全てで表オブジェクトと判定された場合に、最終的に表オブジェクトであると判定する。
そして、表判定部72は、オブジェクトが表であると判断した場合には、入力されたオブジェクトが表オブジェクトであるとして後段の罫線補正処理部46へオブジェクトデータを出力する。一方、表ではないと判断した場合、罫線抽出部70で抽出された罫線の罫線抽出結果を箱表判定部72へ出力する。
箱表判定部72は、罫線抽出結果に基づいて、箱表オブジェクトであるか否かを判定する。ここで、箱表とは、図6に示すように、複数の四角形オブジェクト84によって表が構成されているものをいう。なお、通常の表オブジェクトは、図7に示すように、複数の罫線が交差することにより構成されているオブジェクトをいう。
箱表判定部72では、CGを構成する線と判定されたオブジェクト群で、四角形の閉領域を構成しているオブジェクト、すなわち四角形オブジェクトについて箱表か否かを判定する。まず、最初に着目した四角形オブジェクトのある頂点と、この頂点の隣にある別の四角形オブジェクトの頂点との距離を算出し、この距離が予め定めた閾値以下の場合は、箱表らしさを表す得点を加算していく処理を、全ての四角形オブジェクトの頂点全てについて行う。そして、算出した得点が予め定めた閾値以上の場合に、四角形オブジェクトを箱表と判断する。
箱表判定部72で箱表と判断されなかったオブジェクトについては、そのオブジェクトが元々線画オブジェクトであった場合には、線画オブジェクトとしてCGオブジェクト描画処理部50へ出力し、そのオブジェクトが元々CGオブジェクトであった場合には、CGオブジェクトとしてCGオブジェクト描画処理部50へ出力する。
CG入力制御部68は、例えば操作表示部20に表示されたメニュー画面78において、表認識処理の設定項目のうち、「表より」ボタン80が押下された場合、「CGより」ボタン82が押下された場合によって処理が異なる。これらのボタンのうち、どのボタンが押下されたかを示す情報は、CG入力制御部68に入力される。
CG入力制御部68は、「表より」ボタン80が押下された場合は、属性分離部66から入力されたCGオブジェクトデータを罫線抽出部70へ出力する。また、「CGより」ボタン82が押下された場合は、属性分離部66から入力されたCGオブジェクトデータを罫線抽出部70へ出力せず、そのままCGオブジェクト描画処理部50へ出力する。
このように、「表より」ボタン80が押下された場合は、CGオブジェクトデータが罫線抽出部70へ出力され、「CGより」ボタン82が押下された場合は、CGオブジェクトデータを罫線抽出部70へ出力せず、そのままCGオブジェクト描画処理部50へ出力するので、「表より」ボタン80が押下された場合は、CGオブジェクトが表として認識されやすくなり、「CGより」ボタン82が押下された場合は、CGオブジェクトがCGオブジェクトとして認識されやすくなる。
次に、オブジェクト分離部18で実行される処理について、図8に示すフローチャートを参照して説明する。
まず、ステップ100では、JPEGデコーダー部40により、前述したJPEGデコード処理が実行される。
ステップ102では、オブジェクト分離前処理部42により、前述したオブジェクト分離前処理が実行される。
ステップ104では、オブジェクト分離処理部44により、前述したオブジェクト分離処理が実行される。
ステップ106では、オブジェクト分離処理部44により分離されたオブジェクト毎の処理が実行される。すなわち、表オブジェクトについては、罫線補正処理部46により前述した罫線補正処理が実行され、さらに表描画処理部48により前述した表描画処理が実行される。
また、CGオブジェクト及び線画オブジェクトについては、CGオブジェクト描画処理部50により前述したCGオブジェクト描画処理が実行される。
また、写真オブジェクトについては、写真オブジェクト描画処理部52により前述した写真オブジェクト描画処理が実行される。
また、文字オブジェクトについては、文字描画処理部54により前述した文字描画処理が実行され、さらに、OCR部により前述したOCR処理が実行される。
ステップ108では、描画データマージ処理部58により前述した描画データマージ処理が実行される。
ステップ110では、フォーマット生成部60により前述したフォーマット生成処理が実行される。
(第2実施形態)
次に、本発明の第2実施形態について説明する。なお、第1実施形態と同一部分については同一符号を付し、その詳細な説明は省略する。
図9には、本実施形態に係るオブジェクト分離処理部44Aの機能ブロック図を示した。オブジェクト分離処理部44Aが図3に示したオブジェクト分離処理部44と異なるのは、CG入力制御部68に代えてCG線画入力制御部68Aが、属性分離部66と罫線抽出部70との間に設けられている点である。なお、図9では、連続画素グルーピング部62、文字分離部64、表判定部72、及び箱表判定部72の図示を省略している。
また、本実施形態では、操作表示部20には、図10に示すようなメニュー画面78Aが表示される。表認識処理の設定項目のうち、「表より」ボタン80が押下された場合、「標準」ボタン86が押下された場合、「CGより」ボタン82が押下された場合によって処理が異なる。
なお、「表より」ボタン80は、前述したように、読み取り対象の原稿を読み取ってオブジェクト分離する際に、原稿中の表オブジェクトが表オブジェクトとしてより認識されやすくなるようにしたい場合に押下するボタンである。
また、「CGより」ボタン82は、前述したように、読み取り対象の原稿を読み取ってオブジェクト分離する際に、原稿中のCGオブジェクトがCGオブジェクトとしてより認識されやすくなるようにしたい場合に押下するボタンである。
また、「標準」ボタン86は、読み取り対象の原稿を読み取ってオブジェクト分離する際に、「表より」ボタン80が押下された場合と「CGより」ボタン82が押下された場合との間の標準的な処理が実行されるようにしたい場合に押下するボタンである。
CG線画入力制御部68Aは、「表より」ボタン80が押下された場合は、属性分離部66から入力されたCGオブジェクトデータ及び線画オブジェクトデータを罫線抽出部70へ出力する。また、「CGより」ボタン82が押下された場合は、属性分離部66から入力されたCGオブジェクトデータ及び線画オブジェクトデータを罫線抽出部70へ出力せず、そのままCGオブジェクト描画処理部50へ出力する。これにより、「表より」ボタン80が押下された場合は、より表オブジェクトとして認識されやすくなり、「CGより」ボタン82が押下された場合は、よりCGオブジェクトとして認識されやすくなる。
また、「標準」ボタン86が押下された場合には、CGオブジェクトデータは罫線抽出部70へ出力せずにそのままCGオブジェクト描画処理部50へ出力し、線画オブジェクトデータは罫線抽出部70へ出力する。
なお、本実施形態では、メニュー画面78Aに「標準」ボタン86が設けられているため、図11に示すように、表判定部72の処理で用いられる表判定パラメータ76Aには、「標準」ボタン86が押下された場合の設定値b1〜b4が含まれている。
ここで、本実施形態では、各設定値の大小関係は一例として、a1<b1<c1、a2<b2<c2、a3<b3<c3、a4>b4>c4となっている。
(第3実施形態)
次に、本発明の第3実施形態について説明する。なお、上記実施形態と同一部分については同一符号を付し、その詳細な説明は省略する。
図12には、本実施形態に係るオブジェクト分離処理部44Bの機能ブロック図を示した。オブジェクト分離処理部44Bが図3に示したオブジェクト分離処理部44と異なるのは、CG入力制御部68に代えて罫線抽出制御パラメータ設定部88が設けられている点である。なお、図12では、連続画素グルーピング部62、文字分離部64、表判定部72、及び箱表判定部72の図示を省略している。
罫線抽出制御パラメータ設定部88は、表認識処理の設定で「表より」ボタン80が押下された場合は、属性分離部66から入力されたCGオブジェクトデータ及び線画オブジェクトデータが表オブジェクトと判定されやすくなるような罫線抽出制御パラメータ、すなわち、後段の表判定部72及び箱表判定部72において表オブジェクトと判定されやすくなるような罫線抽出制御パラメータを罫線抽出部70へ出力する。
また、「CGより」ボタン82が押下された場合は、属性分離部66から入力されたCGオブジェクトデータ及び線画オブジェクトデータがCGオブジェクトと判定されやすくなるような罫線抽出制御パラメータ、すなわち、後段の表判定部72及び箱表判定部72においてCGオブジェクトと判定されやすくなるようなパラメータを罫線抽出部70へ出力する。
例えば、図13に示すような、表認識処理の設定毎に予め定められた罫線抽出制御パラメータを罫線抽出部70に対して設定する。図13では、罫線抽出パラメータの一例として、「線又は輪郭の最大連続画素長」、「線又は輪郭間の距離」、「線又は輪郭の最大画素幅」、「線又は輪郭の途切れの合計画素幅」、「線又は輪郭の途切れの平均画素幅」が挙げられているが、これらに限られるものではない。
図13に示すように、各罫線抽出パラメータは、「標準」ボタン86が押下された場合、「表より」ボタン80が押下された場合、「CGより」ボタン82が押下された場合とで、それぞれ異なる設定値(閾値)が設定されている。これらの設定値は、「表より」ボタン80が押下された場合には、入力されたオブジェクトが表オブジェクトと判定されやすくなるように、「CGより」ボタン82が押下された場合には、入力されたオブジェクトがCGオブジェクトと判定されやすくなるように、それぞれ設定される。また、「標準」ボタン86が押下された場合は、「表より」ボタン80が押下された場合の設定値と「CGより」ボタン82が押下された場合の設定値との中間の値が設定される。
ここで、本実施形態では、各設定値の大小関係は一例として、a1<b1<c1、a2<c2、a3>b3>c3、a4>b4>c4、a5>b5>c5となっている。
罫線抽出部70は、上記の各罫線抽出パラメータに基づいて、入力された線画オブジェクト又はCGオブジェクトが表オブジェクトであるか否かを判定する。
例えば、罫線抽出部70では、「線又は輪郭の最大連続画素長」について図13に示すように設定値a1、b1、c1が設定されている場合には、入力された線画オブジェクトデータ又はCGオブジェクトデータに基づいて、線又は輪郭の候補を抽出し、抽出した候補について「線又は輪郭の最大連続画素長」を求める。そして、求めた最大連続画素長と、設定値a1、b1、c1のうち、ユーザーにより設定された表認識処理の設定に対応した設定値とを比較し、求めた最大連続画素長が設定値以上であれば罫線であると判断する。
また、罫線抽出部70は、「線又は輪郭間の距離」について図13に示すように設定値a2、b2が設定されている場合には、入力された線画オブジェクトデータ又はCGオブジェクトデータに基づいて、線又は輪郭の候補を抽出し、抽出した候補について「線又は輪郭間の距離」を求める。そして、求めた距離と、設定値a2、c2のうち、ユーザーにより設定された表認識処理の設定に対応した設定値とを比較し、求めた距離が設定値以上であれば罫線であると判断する。
また、罫線抽出部70は、「線又は輪郭の途切れの最大画素幅」について図13に示すような設定値a3、b3、c3が設定されている場合には、入力された線画オブジェクトデータ又はCGオブジェクトデータに基づいて、線又は輪郭の候補を抽出し、抽出した候補について「線又は輪郭が途切れている部分の最大画素幅」を求める。そして、求めた最大画素幅と、設定値a3、b3、c3のうち、ユーザーにより設定された表認識処理の設定に対応した設定値とを比較し、求めた最大画素幅が設定値以下であれば罫線であると判断する。
また、罫線抽出部70は、「線又は輪郭の途切れの合計画素幅」について図13に示すような設定値a4、b4、c4が設定されている場合には、入力された線画オブジェクトデータ又はCGオブジェクトデータに基づいて、線又は輪郭の候補を抽出し、抽出した候補について「線又は輪郭が途切れている部分の合計画素幅」を求める。そして、求めた最大画素幅と、設定値a4、b4、c4のうち、ユーザーにより設定された表認識処理の設定に対応した設定値とを比較し、求めた合計画素幅が設定値以下であれば罫線であると判断する。
また、罫線抽出部70は、「線又は輪郭の途切れの平均画素幅」について図13に示すような設定値a5、b5、c5が設定されている場合には、入力された線画オブジェクトデータ又はCGオブジェクトデータに基づいて、線又は輪郭の候補を抽出し、抽出した候補について「線又は輪郭が途切れている部分の平均画素幅」を求める。そして、求めた平均画素幅と、設定値a1、b1、c1のうち、ユーザーにより設定された表認識処理の設定に対応した設定値とを比較し、求めた平均画素幅が設定値以下であれば罫線であると判断する。
罫線抽出部70は、上記の各罫線抽出パラメータについて上記のように罫線であるか否かを判断し、例えば全てにおいて罫線と判断された場合には、入力された線画オブジェクト又はCGオブジェクトが表オブジェクトであるものとして、そのオブジェクトデータを後段の罫線補正処理部46へ出力する。一方、表オブジェクトと判定されなかった場合には、入力された元の線画オブジェクト又はCGオブジェクトであるものとして、後段のCGオブジェクト描画処理部50へ出力する。
(第4実施形態)
次に、本発明の第4実施形態について説明する。なお、第1実施形態と同一部分については同一符号を付し、その詳細な説明は省略する。
図14には、本実施形態に係るオブジェクト分離処理部44Cの機能ブロック図を示した。オブジェクト分離処理部44Cが図3に示したオブジェクト分離処理部44と異なるのは、CG入力制御部68に代えてオブジェクト収縮膨張部90A、90B、及び濃度判定部92A、92Bが、属性分離部66と罫線抽出部70との間に設けられている点である。なお、図14では、連続画素グルーピング部62、文字分離部64、表判定部72、及び箱表判定部72の図示を省略している。
オブジェクト収縮膨張部90A、90Bは、予め定めた収縮膨張画素数に基づいて、収縮膨張処理を行う。オブジェクト収縮膨張部90Aは、入力された線画オブジェクトデータに対して収縮膨張処理を行って、濃度判定部92Aに出力する。オブジェクト収縮膨張部90Bは、入力されたCGオブジェクトデータに対して収縮膨張処理を行って、濃度判定部92Bに出力する。
なお、収縮膨張処理では、予め定めた収縮膨張画素数で収縮処理を行った後、同じく予め定めた収縮膨張画素数で膨張処理を行う。この処理は、公知のノイズ除去処理等に用いられる方法が用いられる。
収縮膨張画素数が大きい程、オン画素が少なくなる傾向となり、収縮膨張画素数が小さい程、オン画素が多くなる傾向となる。本実施形態では、線画オブジェクトが入力されるオブジェクト収縮膨張部90Aに設定される収縮膨張画素数が、CGオブジェクトが入力されるオブジェクト収縮膨張部90Bに設定される収縮膨張画素数よりも小さくなるように設定される。従って、オブジェクト収縮膨張部90Aで収縮膨張処理される線画オブジェクトの方が、オブジェクト収縮膨張部90Bで収縮膨張処理されるCGオブジェクトよりも、オブジェクトが強調される。
濃度判定部92A、92Bは、表認識処理の設定に応じて図15に示すような閾値a1、b1、c1(a1<b1<c1)がそれぞれ設定されており、入力されたオブジェクトデータに基づいてオン画素の画素数をカウントし、カウントしたオン画素の画素数と、表認識処理の設定に対応した閾値と、を比較する。すなわち、オブジェクトの濃度が閾値以上であるか否かを判断する。そして、カウントしたオン画素の画素数が閾値以上の場合は、そのオン画素を含むオブジェクトを後段の罫線抽出部70へ出力する。濃度判定部90A、90Bに設定される閾値は、同一としてもよいし、異なる閾値としてもよい。
なお、上記各実施形態では、メニュー画面をユーザーが操作することにより表認識処理の設定を行う場合について説明したが、画像形成装置の仕様として予め定められていてもよい。この場合、例えば不揮発性メモリ18Dやハードディスク34に「表より」、「CGより」、「標準」の何れに設定されているかを記憶しておけばよい。
また、本実施形態で説明した画像形成装置12の構成(図1参照)は一例であり、本発明の主旨を逸脱しない範囲内において不要な部分を削除したり、新たな部分を追加したりしてもよいことは言うまでもない。
また、本記実施形態で説明した制御プログラムの処理の流れ(図8参照)も一例であり、本発明の主旨を逸脱しない範囲内において不要なステップを削除したり、新たなステップを追加したり、処理順序を入れ替えたりしてもよいことは言うまでもない。
18 オブジェクト分離部
40 JPEGデコーダー部
42 オブジェクト分離前処理部
44 オブジェクト分離処理部
46 罫線補正処理部
48 表描画処理部
50 オブジェクト描画処理部
52 写真オブジェクト処理部
54 文字描画処理部
56 OCR部
58 描画データマージ処理部
60 フォーマット生成部
62 連続画素グルーピング部
64 文字分離部
66 属性分離部
68 CG入力制御部
68A CG線画入力制御部
70 罫線抽出部
72 表判定部
74 箱表判定部
88 罫線抽出制御パラメータ設定部
90A、90B オブジェクト収縮膨張部
92A、92B 濃度判定部

Claims (2)

  1. 複数種類の部分画像を含む画像を、予め定めた誤分離しやすい特定種類以外の種類の部分画像に分離する分離手段と、
    前記分離手段により分離した部分画像のうち、予め定めた二種類の部分画像が、前記特定種類の部分画像であると判定しやすくするか否かを設定する設定手段と、
    前記設定手段による設定に基づいて、前記予め定めた二種類の部分画像のうち少なくとも一方の部分画像が、前記特定種類の部分画像であるか否かを判定する判定手段と、
    を備え
    前記二種類の部分画像は、線で構成された線画部分画像及び図形で構成された図形部分画像であると共に、前記特定種類の部分画像は、表で構成された表部分画像であり、
    前記判定手段は、
    受け付けた前記線画部分画像及び前記図形部分画像に含まれる罫線を抽出する罫線抽出手段と、前記罫線抽出手段の罫線抽出結果に基づいて、前記線画部分画像及び前記図形部分画像が表部分画像であるか否かを判定する表判定手段と、
    前記線画部分画像を予め定めた第1の収縮膨張画素数で収縮膨張する第1の収縮膨張手段と、
    前記第1の収縮膨張手段により収縮膨張処理された前記線画部分画像の濃度が、前記設定手段による設定に応じて定められた閾値以上の場合に、前記線画部分画像を前記罫線抽出手段へ出力する第1の濃度判定手段と、
    前記図形部分画像を前記第1の収縮膨張画素数より大きい第2の収縮膨張画素数で収縮膨張処理する第2の収縮膨張手段と、
    前記第2の収縮膨張手段により収縮膨張処理された前記図形部分画像の濃度が、前記設定手段による設定に応じて定められた閾値以上の場合に、前記図形部分画像を前記罫線抽出手段へ出力する第2の濃度判定手段と、
    を含む画像処理装置。
  2. コンピュータを、請求項1に記載の画像処理装置を構成する各手段として機能させるための画像処理プログラム。
JP2010202224A 2010-09-09 2010-09-09 画像処理装置及び画像処理プログラム Expired - Fee Related JP5720154B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2010202224A JP5720154B2 (ja) 2010-09-09 2010-09-09 画像処理装置及び画像処理プログラム
US13/011,486 US8494266B2 (en) 2010-09-09 2011-01-21 Image processing apparatus, image processing method, and computer-readable recording medium
CN201110053762.4A CN102404472B (zh) 2010-09-09 2011-03-07 图像处理装置和图像处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010202224A JP5720154B2 (ja) 2010-09-09 2010-09-09 画像処理装置及び画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2012060465A JP2012060465A (ja) 2012-03-22
JP5720154B2 true JP5720154B2 (ja) 2015-05-20

Family

ID=45806779

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010202224A Expired - Fee Related JP5720154B2 (ja) 2010-09-09 2010-09-09 画像処理装置及び画像処理プログラム

Country Status (3)

Country Link
US (1) US8494266B2 (ja)
JP (1) JP5720154B2 (ja)
CN (1) CN102404472B (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9030714B2 (en) * 2012-03-22 2015-05-12 Canon Kabushiki Kaisha Image processing apparatus and image processing method to set appropriate ink amount for character data and for image data
JP6025803B2 (ja) * 2014-11-06 2016-11-16 京セラドキュメントソリューションズ株式会社 画像処理装置
CN104780465B (zh) * 2015-03-25 2018-09-04 小米科技有限责任公司 画面参数调节方法及装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4742558A (en) * 1984-02-14 1988-05-03 Nippon Telegraph & Telephone Public Corporation Image information retrieval/display apparatus
JPH0721310A (ja) * 1993-06-30 1995-01-24 Matsushita Electric Ind Co Ltd 文書認識装置
US5737442A (en) * 1995-10-20 1998-04-07 Bcl Computers Processor based method for extracting tables from printed documents
JPH09319878A (ja) * 1996-05-29 1997-12-12 Fuji Xerox Co Ltd 画像識別装置
JP3384299B2 (ja) * 1997-10-15 2003-03-10 富士ゼロックス株式会社 画像処理装置および画像処理方法
JP4496602B2 (ja) * 2000-05-17 2010-07-07 コニカミノルタビジネステクノロジーズ株式会社 画像処理方法および画像処理装置
JP3882585B2 (ja) * 2001-11-07 2007-02-21 富士ゼロックス株式会社 画像処理装置およびプログラム
JP4012140B2 (ja) * 2003-11-20 2007-11-21 キヤノン株式会社 画像処理装置、情報処理装置及びそれらの制御方法、プログラム
US20050145922A1 (en) 2003-12-30 2005-07-07 Joseph Farley EEPROM and flash EEPROM
JP2006340103A (ja) * 2005-06-02 2006-12-14 Canon Inc 画像処理装置、方法及びプログラム

Also Published As

Publication number Publication date
CN102404472B (zh) 2015-08-19
CN102404472A (zh) 2012-04-04
US20120063683A1 (en) 2012-03-15
JP2012060465A (ja) 2012-03-22
US8494266B2 (en) 2013-07-23

Similar Documents

Publication Publication Date Title
JP4745830B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
US8126270B2 (en) Image processing apparatus and image processing method for performing region segmentation processing
JP4310288B2 (ja) 画像処理装置及びその方法、プログラム並びに記憶媒体
EP1826720B1 (en) Image processing apparatus and method, computer program, and storage medium
JP4574313B2 (ja) 画像処理装置および方法
JP5594269B2 (ja) ファイル名作成装置、画像形成装置、およびファイル名作成プログラム
JP5720154B2 (ja) 画像処理装置及び画像処理プログラム
JP5178490B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP2006295624A (ja) 画像処理装置およびその方法、並びに、コンピュータプログラムおよび記録媒体
JP4483567B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP5335581B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP2020204905A (ja) 文字認識装置、文書ファイル生成方法、文書ファイル生成プログラム
JP2007221340A (ja) 画像ファイル生成方法及び画像ファイル生成装置
JP5673277B2 (ja) 画像処理装置およびプログラム
JP2015159427A (ja) 画像読取装置、画像読取装置の制御方法及び制御プログラム
JP6413450B2 (ja) 画像処理装置、画像形成装置およびプログラム
JP7205292B2 (ja) 情報処理装置及び画像形成装置
JP4904911B2 (ja) 画像処理装置及びその制御方法
JP2011087113A (ja) 画像形成装置、画像処理プログラム
JP4957570B2 (ja) 画像処理装置
JP6413783B2 (ja) 印刷指示装置、印刷システムおよびプログラム
JP2016163141A (ja) 画像処理装置、画像処理方法およびプログラム
JP2023091487A (ja) 画像処理装置、画像処理方法及びプログラム
JP6172010B2 (ja) 画像処理装置およびプログラム
JP2013150111A (ja) 画像処理装置および画像処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130819

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140822

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140902

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140926

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150224

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150309

R150 Certificate of patent or registration of utility model

Ref document number: 5720154

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees