JP2007166287A - 画像処理装置、および画像処理方法 - Google Patents

画像処理装置、および画像処理方法 Download PDF

Info

Publication number
JP2007166287A
JP2007166287A JP2005360487A JP2005360487A JP2007166287A JP 2007166287 A JP2007166287 A JP 2007166287A JP 2005360487 A JP2005360487 A JP 2005360487A JP 2005360487 A JP2005360487 A JP 2005360487A JP 2007166287 A JP2007166287 A JP 2007166287A
Authority
JP
Japan
Prior art keywords
image
image processing
processing
character
ocr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005360487A
Other languages
English (en)
Inventor
Hiroyoshi Kamijo
裕義 上條
Toru Misaizu
亨 美斉津
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2005360487A priority Critical patent/JP2007166287A/ja
Priority to US11/447,988 priority patent/US20070133020A1/en
Publication of JP2007166287A publication Critical patent/JP2007166287A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • H04N1/58Edge or detail enhancement; Noise or error suppression, e.g. colour misregistration correction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

【課題】人間の見た目の画質ではなく、OCR処理という観点から見た高画質を達成し得る画像処理装置、画像処理方法を提供する。
【解決手段】入力された画像データに対して画像処理を施す画像処理部10にて、画像出力後にOCR処理が施されることを前提としたプリント画像を出力するためのOCRモードが指定されていることを認識し、通常の画像処理に代えてOCR処理のために有効な特定の画像処理をコントローラ11およびエンジン制御部12にて施す。
【選択図】図2

Description

本発明は、ホストコンピュータ等にて作成された文書を画像形成装置により印字出力するための画像処理を行う画像処理装置、および画像処理方法に関する。
従来、プリントサンプルをスキャナ(画像読取装置)にて読み込み、ラスタ画像をコード化する技術としてOCR(Optical Character Reader)がある。このOCRでは、手書き文字や印字された文字などをスキャナで光学的に読み取り、予め記憶されたパターンと照合して文字情報を特定し、データとしての文字(文字データ)を入力している。
公報記載の従来技術として、文字として認識しなくても良い領域を文字領域として誤判定し、この誤判定された文字領域に対しても文字認識処理を実行してしまうという課題に対処したものが存在する(例えば、特許文献1参照。)。この特許文献1では、OCRさせる部分に原稿上マーカで色を塗り、その部分を認識させることで、領域分割の精度を高め、認識処理の効率を高める提案がなされている。
また、他の公報記載の技術として、写真部と文字部の画質両立を目的に、オブジェクト毎にTagをつけて、オブジェクト毎にスクリーンを切り替える処理が行われている(例えば、特許文献2参照。)。この特許文献2に記載の技術によれば、それぞれの画像要素の持つ特性に適応した画像処理を行うことが可能となり、高画質な画像形成を行うことができる。
特開平11−191136号公報 特開平8−235346号公報
ここで、現状のOCR技術では、ドキュメントの文字情報を100%コード化することは困難であり、コード化を良好に行えない様々な画像が存在する。OCRに不向きな画像としては、例えば、線画が混在するドキュメントや、薄い色で書かれた文字、低解像度情報の文字等がある。
他方、電子化の中でオリジナルの電子ドキュメントをやり取りすれば、わざわざ紙に出力(プリントアウト)してOCR処理しなくても済むとの考えもある。しかしながら、例えば電子文書に関する日本国の法律(例えば電子文書法)等により紙と電子の両方の原本が必要となるケースがあり、また、現状では、例えば交通費処理、領収書を貼って割印する等の紙を原本として採用する文化が根強く存在している。その結果、かかる紙に記載された文字を読み取ってデータとして入力する要求は依然として強く、プリントアウトした用紙に対するOCR処理の要求は非常に高い。
上記特許文献1に記載の技術は、読み取り領域を知る上での1つの提案とはなり得る。しかしながら、人手によりマーカを塗る手間が必要になるとともに、小さな文字が込み入った箇所でのマーキングミスが問題となる恐れがある。また、マーカを塗ったことで、文字と背景とのコントラストが取れなくなり、かえって誤認識の確率が高まることも予想される。更には、例えば国税局に納める納税証明書などのように、紙原稿がオリジナルとなる場合には、マーカでオリジナルを汚すことや加筆することができず、この技術を利用することができない。
また、現状、プリントサンプルとして、人間の見た目で高画質になる場合と、OCR機能から見て高画質になる場合とは必ずしも一致しない。上記特許文献2の技術を採用することで、人間の見た目の高画質は達成できるが、コード化処理の観点から見て更に高画質化のための施策が必要となる。
本発明は、以上のような技術的課題を解決するためになされたものであって、その目的とするところは、人間の見た目の画質ではなく、機械認識機能という観点から見た高画質を達成し得る画像処理装置、画像処理方法を提供することにある。
また他の目的は、機械認識機能という観点から見た高画質を達成し得る特定モードを設け、後処理で例えばOCRをかける予定がある場合に、予めプリント時にOCRが判断し易い画像を出力することにある。
かかる目的のもと、本発明は、プリントサンプルとして、人間の見た目の高画質と機械認識機能からみた高画質は必ずしも一致しない点に着目し、人間の見た目の画質上には必ずしも好ましくないが、機械認識機能という観点からみた高画質を達成しうるモードを設けた。そして、後処理でOCR(Optical Character Reader)などの機械認識処理をかける予定がある場合は、プリント時にOCRが判断しやすいように出力画像をエンハンスして出力している。即ち、本発明は、入力された画像データに対して画像処理を施す画像処理装置であって、画像出力後に機械認識処理が施されることを前提としたプリント画像を出力するための機械認識処理モードが指定されていることを認識する認識手段と、この認識手段により機械認識処理モードの指定が認識された場合に、通常の画像処理に代えて機械認識処理のための特定の画像処理を施す処理手段とを備えたことを特徴としている。
ここで、この認識手段により認識される機械認識処理モードは、画像出力後にOCR処理が施されることを前提とするモードであることを特徴とすることができる。
また、この処理手段は、機械認識処理が実行される箇所である文字部を機械認識し易くなるように加工することを特徴としている。
更にこの処理手段は、入力された画像データのプリントコマンドに応じたオブジェクト分離を実施し、このオブジェクト分離によって分離された文字部について画像濃度を飽和させ、または黒(100%)一色に置き換えることを特徴としている。
ここで、この処理手段は、入力された画像データがラスタ画像である場合にエッジ抽出処理を行い、このエッジ抽出処理により抽出されたエッジ部に対して画像濃度を飽和させることで、濃度の低い文字のコード化処理を良好にすることを特徴としている。
また、この処理手段は、入力された画像データのプリントコマンドに応じたオブジェクト分離を実施し、このオブジェクト分離によって分離された線画部で指定されるエリアについて機械認識され難くなるように画像処理を施すことを特徴とすることができる。
更に、この処理手段は、線画部で指定されるエリアの濃度を、例えば白(0%)に置き換えるなど、減ずることを特徴とすることができる。
また更に、この処理手段は、線画部で指定されるエリアをスキャナの読み取り難い色に置き換えることを特徴としている。
他の観点から捉えると、本発明は、特定のフォントを有する文字線画情報に画像処理を施して画像データを出力する画像処理装置であって、文字線画情報を入力する入力手段と、 この入力手段により入力された文字線画情報の中から、プリント出力後に機械認識処理がなされるであろう文字線画情報のフォントを、機械認識処理のための特定のフォントに変換する変換手段とを備えたことを特徴としている。
ここで、この機械認識処理のためのプリント出力である機械認識処理モードのユーザ指定を認識する認識手段を更に備え、変換手段は、認識手段による認識からプリント出力後に機械認識処理がなされるものとしてフォントの変換を行うことを特徴としている。
また、この変換手段は、文字線画情報のフォントをボールドのフォントに変換することを特徴とすることができる。
更に、この変換手段は、文字線画情報のフォントを、機械認識処理を容易とするサイズに変換することを特徴としている。例えば、小さいフォントを大きなフォントに変換することで、認識率を上げることができる。
また更に、この変換手段は、文字線画情報のフォントに強調処理を施すことを特徴とすることができる。
また、この変換手段は、フォントの中の小さい記号についてサイズを拡大して出力することを特徴とすることができる。例えば、句読点、小数点、カンマ、ダッシュ、ピリオドなどである。これらのサイズを拡大することで、OCR処理に際して誤って認識される確率を大幅に減らすことが可能となる。
ここで、入力された文字線画情報が色背景中にあるか否かを判断する手段を更に備え、文字線画情報が色背景中にあると判断される場合に、この色背景の濃度を減ずることを特徴とすれば、文字線画情報の認識を助けることができる点で優れている。
一方、本発明を方法のカテゴリから捉えると、本発明は、入力された画像データに対して画像処理を施す画像処理方法であって、画像出力後にOCR処理が施されることを前提としたプリント画像を出力するためのOCRモードの指定情報を入力し、このOCRモードの指定情報を入力した場合に、OCR処理に際して文字部が認識し易くなるように、通常の画像処理に代え特定の画像処理を施すことを特徴としている。ここで、この特定の画像処理は、入力された画像データの有する文字部のフォントを、OCR処理の認識がし易いフォントに変換して出力することを特徴とすることができる。
本発明によれば、人間の見た目の画質ではなく、機械認識機能という観点から見た高画質を達成し得る画像処理装置、画像処理方法を提供することが可能となる。
以下、添付図面を参照し、本発明の実施の形態について詳細に説明する。
〔実施の形態1〕
図1は、本実施の形態が適用されるプリンタシステムの全体構成を示した図である。ここでは、入力された電子文書の情報を画像展開して用紙上に印刷する画像形成装置1と、この画像形成装置1に対して電子文書を提供するホストコンピュータであるクライアントPC(パーソナルコンピュータ)2とが示されている。この画像形成装置1には、クライアントPC2以外の、図示しない画像読み取り装置(IIT)などから画像データが入力される場合がある。画像形成装置1は、OCR(Optical Character Reader)の対象となるプリント画像を出力(プリントアウト)する。
この画像形成装置1は、例えばクライアントPC2から出力された電子文書の画像データに対して所定の画像処理を施す画像処理部(IPS:Image Processing System)10と、電子写真方式を利用した所謂タンデム型のデジタルカラープリンタであるマーキングエンジン30とを備えている。マーキングエンジン30は、水平方向に一定の間隔を置いて並列的に配置される複数のエンジンからなる画像形成ユニット31Y,31M,31C,31Kを備え、イエロー(Y)、マゼンタ(M)、シアン(C)、黒(K)のトナー像を形成し、用紙上にトナー像を順次、転写している。この4つの画像形成ユニット31Y,31M,31C,31Kは、夫々、静電潜像を形成してトナー像を担持させる像担持体(感光体)である感光体ドラム32、感光体ドラム32の表面を一様に帯電する帯電器33、帯電器33によって帯電された感光体ドラム32を露光する露光器34、露光器34によって得られた静電潜像を現像する現像器35を備えている。また、感光体ドラム32の表面上に形成されたトナー像を用紙に転写させる転写ロール36を備えている。そして、マーキングエンジン30は、各画像形成ユニット31Y,31M,31C,31Kの感光体ドラム32と転写ロール36とによって形成される転写位置に対して用紙を搬送する用紙搬送ベルト37を備えている。また、用紙上に転写されたトナー像を定着させる定着器38を備えている。
クライアントPC2から入力された画像データは、画像処理部10によって画像処理が施され、所定のインタフェースを介してマーキングエンジン30に供給される。マーキングエンジン30では、図示しない画像出力制御部から供給された同期信号等の制御信号に基づいて動作する。まず、イエロー(Y)の画像形成ユニット31Yは、帯電器33により帯電された感光体ドラム32の表面に、画像処理部10から得られた画像信号に基づいて露光器34によって静電潜像を形成する。その静電潜像に対して現像器35によってイエロー(Y)のトナー像を形成し、形成されたイエロー(Y)のトナー像は、図の矢印方向に回動する用紙搬送ベルト37上の用紙に転写ロール36を用いて転写される。同様にして、マゼンタ(M)、シアン(C)、黒(K)のトナー像が各々の感光体ドラム32上に形成され、用紙搬送ベルト37上の用紙に転写ロール36を用いて多重転写される。多重転写された用紙上のトナー像は、定着器38に搬送されて、熱および圧力によって用紙に定着される。
次に、本実施の形態が適用される画像処理方法について説明する。
図2は、本実施の形態が適用されるプリンタシステムの機能構成を示すブロック図である。画像処理部10は、大きくコントローラ11とエンジン制御部12とを備えている。コントローラ11は、クライアントPC2から送られてくるPDL(Page Description Language:ページ記述言語)をコマンド解釈するPDL解釈部21と、PDL指定の色信号(RGB)からマーキングエンジン30の色信号(YMCK)に変換する描画部22とを備えている。また、描画部22にて描画された中間コードをマーキングエンジン30に適合した画像データにレンダリングするレンダリング部23を備えている。
一方、エンジン制御部12は、レンダリングされた画像に対してエッジ判定を行うエッジ判定部24と、エッジ判定がなされた画像に対してスクリーン処理(2値化処理)を施すスクリーン部25とを備えている。また、スクリーン部25にてスクリーニングされた画像データにパルス幅変調を施すパルス幅変調部26を備えている。パルス幅変調部26によりパルス幅変調が施された画像データは、マーキングエンジン30へ出力される。
ここで、本実施の形態では、画像形成装置1にてOCRなどの機械認識用にプリント出力を行う場合に、「OCRモード」という特定モード(機械認識処理モード)を設定可能としている。このOCRモードでは、プリント出力後のOCRにおけるコード化処理が良好に行えるように、プリント出力時に画像加工(画像エンハンス)を施すものである。この画像加工は、画像形成装置1にて行う場合や、クライアントPC2で行う場合がある。そして、画像形成装置1にあっては、例えば本体に設けられたコントロールパネル(図示せず)に、ユーザが選択可能なインタフェースを設け、このインタフェースを介してユーザからのOCRモード指定を入力可能とする方法が挙げられる。また、クライアントPC2にあっては、例えばプリント出力に関するアプリケーションの実行時にて印刷出力を指示する際に、OCRモードを選択可能とし、この選択を認識してOCRモードへ移行する方法がある。
ここで、OCRモードが利用される態様としては、例えば交通費の精算書類をプリントアウトする場合が挙げられる。この精算書類では、交通費の額が所定の領域に記載された画像をプリントアウトし、このプリントアウト紙の空白部分に例えば領収書が貼り付けられる。この交通費の額だけを、プリントアウト後にOCRで読み取る場合に、OCRモードで印刷することで、OCRの良好な読み取りが可能となる。また、OCRモード利用の他の態様として、例えば納税書や決算書の印刷、メールアドレスやURLの印刷など、広く応用することができる。
次に、前述したOCRモード処理について詳述する。
図3は、本実施の形態のプリンタシステムにて実行されるOCRモード処理を示したフローチャートである。ステップ101からステップ103まではクライアントPC2にて実行される処理であり、ステップ104からステップ111までは、画像処理部10において実行される処理である。
まず、例えばクライアントPC2上で、ユーザによってなされたOCRモード選択を認識する(ステップ101)。また、クライアントPC2のプリンタドライバにて、アプリケーションからのコマンドをプリンタの描画コマンドであるPDL(ページ記述言語)に変換する(ステップ102)。このプリンタドライバにて変換されたPDLの描画コマンドは、クライアントPC2から画像処理部10に送られる(ステップ103)。
この画像処理部10では、PDL解釈部21にて、取得されるPDLのコマンドが解釈される(ステップ104)。その後、描画部22は、解釈されたPDLにより指定される色信号(RGB)を、マーキングエンジン30の色信号(YMCK)に変換する(ステップ105)。ここで、色変換に際し、ステップ101でOCRモードが指定されているときには、線画コマンド領域は画像信号を0にし、文字部領域は255に飽和させる(ステップ106)。尚、描画部22にて描画する際には、ラスタ(イメージ)データはマーキングエンジン30のエンジン解像度へ変換し、文字(テキスト)、グラフィックスはエンジン解像度として好ましいコードである中間コードに一旦、変換した後に描画することもできる。また、描画部22では、描画する際に、コマンドに応じ、ラスタ(イメージ)/文字(テキスト)/グラフィックスにそれぞれオブジェクトTag(タグ)を付ける(ステップ107)。このTagは各画素毎に付くものとする。
ここで、通常モードで動作しているときの文字部領域については、色の識別性(階調性)を考えて例えば300線以下で印字する。また、ユーザによりOCRモードが選択されているときの文字部領域については、ジャギーがコード化処理の妨げになるので、例えば600線以上で印字させるようにTagが付けられる。尚、ステップ106で文字部領域を飽和させているのでスクリーン線は関係ないと考えるが、階調補正用のTRC(tone reproduction control)処理が後段で実施されることから、線数は高いほど良い。尚、本実施形態では、スクリーニングはエンジン制御部12のスクリーン部25で行っているが、負荷分散によりコントローラ11の描画部22でスクリーニングを行うことも可能である。このようにしてコントローラ11で処理された画像データとTagデータとは、エンジン制御部12に入力される。
エンジン制御部12のエッジ判定部24では、例えば3×3のエッジ抽出フィルタを用いてエッジ抽出が行われる(ステップ108)。ここで、通常モードの処理においては、エッジ部はオブジェクトに関わらず600線のTagに置き換え、エッジ部画像データには600線用のγ補正をかける。また、このとき、非エッジ部はスルーされる。このように、オブジェクト分離を行い、かつエッジ判定を行う理由は、処理によってはOCR読み込み対象となる文字をラスタ画像で出力する場合もあり、また、オブジェクト判定が必ずしも100%有効ではないことから、このエッジ判定を組み合わせで処理している。
ここで、OCRモードが選択されている場合には、エッジ判定部24でエッジであると判定され、かつ1/255以上の信号のあるエリア(領域)の画像データを飽和させ、Tagを600線に置き換える処理が行われる(ステップ109)。このようにしてTagが付けられた画像データは、スクリーン部25へ送られる。その後、スクリーン部25では、Tagに応じたスクリーン処理が実行される(ステップ110)。例えば、エッジ部は600線のスクリーンで処理され、非エッジ部はオリジナルのスクリーン(例えば、イメージは200線、グラフィックスは150線、文字は300線で処理される。そして、スクリーン処理された画像はパルス幅変調部26へ入力される。スクリーン部25でスクリーニングされた画像データについて、このパルス幅変調部26にてパルス信号として変調され、パルス変調された画像データが、マーキングエンジン30へ出力される(ステップ111)。画像データを取得したマーキングエンジン30では、図1に示すような各構成要素によって用紙上へカラー画像が形成され、プリント出力がなされる(ステップ112)。
図4は、ポストスクリプト(PostScript)(登録商標)言語の描画コマンドからのオブジェクト分離例を示した図である。図4には、イメージの例51、文字の例52、グラフィックスの例53が示されている。文字の例52を取り上げて説明すると、”/Helvetica findfont 12 scale font setfont” は、フォントの設定であり、/Helvetica はフォントの名前、 12はポイント(1/72 inch) 単位の文字の大きさを示している。また、”288 720 moveto” は、位置の指定であり、原点は左下、単位はポイント(1/72 inch) を示す。288はX座標、720はY座標 を示している。更に、”(ABC) show” は、カッコの中が表示する文字列、”show” がそれを表示させる命令を示している。描画部22は、PDL解釈部21にて解釈(図3のステップ104参照)されたこれらのコマンドによって、オブジェクト分離を行う。
図5(a),(b)は、Tagおよび各オブジェクトの処理例を示した図である。図5(a)は通常モードの処理であり、図5(b)はOCRモードの処理を示している。それぞれ、矢印の左側がコントローラ11側の処理を示し、矢印の右側がエンジン制御部12側の処理を示している。図5(a)に示す通常モードでは、図3のステップ107に示すように、図4に示すようなPDLのコマンドで分離されるイメージ、文字(テキスト)、グラフィックスに、Tagの00、01、10が付される。この図5(a)では、画像データは所定の色補正が施される。更に図5(a)に示すエンジン制御部12側では、図3のステップ108に示したエッジ処理が行われ、エッジ部にTagの11が付される。このエッジの画像データには、γ強調が施され、前述のように600線のスクリーン処理が施される。
一方、図5(b)に示すOCRモードの処理では、図3のステップ106に示すように、文字(テキスト)領域の画像信号が255に飽和される。また、このステップ106に示すように、描画コマンド領域の画像信号、即ち、グラフィックスの線画を構成する画像信号を所定濃度以下(例えば0(白))にする。エンジン制御部12側では、図3のステップ108に示したエッジ処理が同様に行われ、エッジ部にTagの11が付される。このエッジ部の画像データは、255に飽和される。また、文字(テキスト)領域は、600線のスクリーンが用いられる。これによって、OCR処理にて読み取られる、または読み取られる可能性の高い領域について、コード化処理を行い易くすることができる。
このように、本実施の形態では、後にスキャンしコード化処理を施されることを前提とする画像データを出力する際の特定モードとして、OCRモードを設けた。そして、このOCRモードでは、コード化処理が良好に行えるように、プリント出力時に画像加工(画像エンハンス)を施している。この画像加工では、送られてくるラスタ画像に対し、エッジ抽出処理を施し、エッジ部に対して画像濃度を飽和させている。これによって、例えば薄い文字に対するコード化処理を良好に行うことが可能となる。また、この画像加工では、プリントコマンドに応じてオブジェクト分離を実施し、文字部もしくは高線数(600線以上)で指定されるエリアについては、黒(100%)の1色に置き換えることができる。更に、この画像加工では、プリントコマンドに応じてオブジェクト分離を実施し、文字部もしくは高線数(600線以上)で指定されるエリアについては、その画素濃度を飽和させることが可能である。
更に、本実施の形態では、プリントコマンドに応じてオブジェクト分離を実施し、線画部で指定されるエリアについては、その画素濃度を下げるように変えて印字させている。この画像濃度では、線画濃度は白(0%)に置き換える。
ここで、線画濃度は、例えばブルーや黄色のような、スキャナで読み取りにくい特定色に置き換えることも好ましい。また、この線画濃度の制御は、線画の幅に応じて、加工処理を切り替えることも有効である。例えば、帳票の線は白に置き換え、表の枠は強調する等である。更に、プリントコマンドに応じてオブジェクト分離を実施し、重ね合わせ文字エリアを検出し、背景部色を白に置き換えるように構成することもできる。特に、背景と文字とのコントラストの差が小さい場合に、背景部分を白に置き換えることは、コード化処理を良好に行うためには有効である。また更に、画像加工において、フォント(Font)を解釈し、句読点や小数点、ダッシュやピリオド、カンマなど、小さい記号の場合はサイズを拡大して出力することを特徴とすることもできる。このように、小さい記号を強調することで、これらの認識率を高めることが可能となり、OCRで読み取った後に、人手によって修正を施す等の後処理を軽減することが可能となる。特に小数点を、句読点やカンマなどと読み違えるか否かは、OCRの認識率に大きく影響する。したがって、これらの認識率を大幅に向上させることのできる本実施の形態の意義は大きい。
尚、OCRモードにて、文字だけを2400線、線画を600線、中間調を200線程度とし、文字情報のみを高線数かつハイガンマ(Hi−γ)で印字させることも有効である。これによって、文字のつぶれを防ぎ、認識率を上げたOCR処理が可能となる。
〔実施の形態2〕
実施の形態1では、OCR処理がし易いように、プリント出力時に画像処理部10にて画像をエンハンスしている。実施の形態2では、クライアントPC2側および/または画像処理部10側にて、例えばフォントを変えることによってOCR用のプリント出力を実現する点に特徴がある。尚、実施の形態1と同様の機能については同様の符号を用い、ここではその詳細な説明を省略する。
図6は、実施の形態2におけるOCRモード処理の流れを示すフローチャートである。この処理は、図2に示すクライアントPC2のアプリケーション(プリンタドライバ)、または画像処理部10にて実現できる。まず、画像処理部10のコントローラ11やクライアントPC2のアプリケーションでは、ユーザによるOCRモード選択を認識する(ステップ201)。そして、テキスト(文字)や線などの文字線画の画像データと、写真などの中間調の画像データとを分離する(ステップ202)。この分離では、例えば図4に示すようなコマンドによる分離が行われる。分離した結果として、文字線画か否かが判断される(ステップ203)。文字線画ではない場合には、処理が終了する。文字線画である場合には、例えば文字線画情報をラスタ情報に変換する際に、フォントの種類、フォントの大きさを変更する(ステップ204)。
このフォントの種類の変更としては、例えば通常より太くした書体であるボールドへ変更するものがある。また、例えば、明朝文字をArialボールドのフォントに強制的に変換させて出力させることも好ましい。即ち、OCR誤認識の例として文字のカスレが挙げられる。例えば、明朝文字は細線部分が多く、カスレが生じ易い。そこで、明朝文字などを、細線による表現の少ないボールドなどのフォントに変換して出力する。このように、OCRによる文字認識がし易いフォントで印字することによって、例えば、プリント出力に際して明朝文字の細線部分などにカスレが生じOCRの誤認識が発生する、といったトラブル発生を未然に防止することができる。
また、OCR認識に際して、文字が薄いと、二値化した場合に閾値以下となって認識できなくなる可能性がある。そこで、色文字の色を黒に置換して出力することも有効である。
更に、スキャナの解像度に対してフォントの文字が小さく、OCRの読み取りが正確に行われない場合がある。そこで、文字のフォントサイズを、例えば10ポイントから14ポイント等に変換して出力する方法も好ましい。
また、ステップ204のフォントの変更に加えて、またはこれに代えて、フォントの強調処理を実施する(ステップ205)。このフォントの強調処理としては、OCRさせたい文字の部分にアンダーラインを入れることや、OCRさせたい文字だけを抽出して赤い色の文字に変更する等が挙げられる。即ち、OCRさせたい部分が予め解っている場合に、このような強調処理を施す。このような強調処理が施されたプリント画像を読み込んで実際にOCR処理を行うことで、OCR読み込み装置によるOCR箇所の認識が容易となる。その結果、OCRの処理効率を高めることができる。
更に、これらの処理に加えて、またはこれに代えて、フォントの周囲が色背景か否かが判断される(ステップ206)。色背景ではない場合には、処理が終了する。色背景である場合には、背景部の濃度を所定濃度以下(例えば白(0%))に変換し(ステップ207)、処理を終了する。このように背景部の濃度を所定濃度以下(例えば白(0%))に変換することで、OCR処理に際して文字の読み込みが容易となり、OCR認識結果を良好とすることができる。
尚、プリント出力後に機械認識処理がなされるであろう(なされると予想される)文字線画情報のフォントは、OCRモードの指定に加え、予め領域を指定してプリントアウトすることによって、より効果を高めることができる。例えば、決算書などでは、OCRの認識を必要とする領域が予め定まっている。従って、所定のアプリケーションによって、領域を指定して特定領域だけについてOCRモードのプリントアウトを指定できるようにすれば、本実施の形態における効果をより高めることが可能となる。
このように、実施の形態2では、例えば文字線画情報をラスタ情報に変換する際、認識させる文字情報について、予め変換手段でフォントを変更している。このフォントの変更として、例えばフォントを予めボールドに変えておくことや、予めOCRの読み込みに適した大きさにフォントサイズを変えておくことが挙げられる。また、フォントの変更または強調として、フォントにアンダーラインを入れておくことや、フォントの色を変えておくことも有効である。更に、色背景中の文字は背景部の濃度を所定濃度以下(例えば白(0%))に置換しておく。このように構成することで、従来技術のようにマーカを塗るといった面倒な処理が不要となり、マーキングミスによる誤認識も防止することができる。また、オリジナルの原稿を汚すことなく、OCRの認識率を向上させることが可能となる。
以上、詳述したように、本実施の形態(実施の形態1および2)では、人間の見た目の高画質ではなく、OCR機能から見た高画質という概念を導入している。即ち、例えば人間の見た目の画質上は好ましくはないが、OCR機能といった機械認識機能から見た高画質なプリント出力を達成し得るOCRモードを設けた。更に言い換えると、紙に印字するときにOCRの認識率を踏まえて印字する。そして、プリント出力後にOCRをかける予定のある画像に対し、例えばユーザからのOCRモードの選択を認識することで、OCR機能から見た高画質処理を実行している。これによって、プリントアウトされた後の画像にOCR処理などの機械認識処理を施した場合に、認識率を向上させることが可能となり、OCR処理の速度向上などを図ることが可能となる。
本実施の形態が適用されるプリンタシステムの全体構成を示した図である。 本実施の形態が適用されるプリンタシステムの機能構成を示すブロック図である。 本実施の形態のプリンタシステムにて実行されるOCRモード処理を示したフローチャートである。 ポストスクリプト言語の描画コマンドからのオブジェクト分離例を示した図である。 (a),(b)は、Tagおよび各オブジェクトの処理例を示した図である。 実施の形態2におけるOCRモード処理の流れを示すフローチャートである。
符号の説明
1…画像形成装置、2…クライアントPC(パーソナルコンピュータ)、10…画像処理部(IPS)、11…コントローラ、12…エンジン制御部、21…PDL解釈部、22…描画部、23…レンダリング部、24…エッジ判定部、25…スクリーン部、26…パルス幅変調部、30…マーキングエンジン

Claims (17)

  1. 入力された画像データに対して画像処理を施す画像処理装置であって、
    画像出力後に機械認識処理が施されることを前提としたプリント画像を出力するための機械認識処理モードが指定されていることを認識する認識手段と、
    前記認識手段により前記機械認識処理モードの指定が認識された場合に、通常の画像処理に代えて前記機械認識処理のための特定の画像処理を施す処理手段と
    を備えたことを特徴とする画像処理装置。
  2. 前記認識手段により認識される機械認識処理モードは、画像出力後にOCR(Optical Character Reader)処理が施されることを前提とするモードであることを特徴とする請求項1記載の画像処理装置。
  3. 前記処理手段は、機械認識処理が実行される箇所である文字部を機械認識し易くなるように加工することを特徴とする請求項2記載の画像処理装置。
  4. 前記処理手段は、入力された前記画像データのプリントコマンドに応じたオブジェクト分離を実施し、当該オブジェクト分離によって分離された文字部について画像濃度を飽和させ、または黒(100%)一色に置き換えることを特徴とする請求項3記載の画像処理装置。
  5. 前記処理手段は、入力された前記画像データがラスタ画像である場合にエッジ抽出処理を行い、当該エッジ抽出処理により抽出されたエッジ部に対して画像濃度を飽和させることで、濃度の低い文字のコード化処理を良好にすることを特徴とする請求項2記載の画像処理装置。
  6. 前記処理手段は、入力された前記画像データのプリントコマンドに応じたオブジェクト分離を実施し、当該オブジェクト分離によって分離された線画部で指定されるエリアについて機械認識され難くなるように画像処理を施すことを特徴とする請求項1記載の画像処理装置。
  7. 前記処理手段は、前記線画部で指定されるエリアの濃度を減ずることを特徴とする請求項6記載の画像処理装置。
  8. 前記処理手段は、前記線画部で指定されるエリアをスキャナの読み取り難い色に置き換えることを特徴とする請求項6記載の画像処理装置。
  9. 特定のフォントを有する文字線画情報に画像処理を施して画像データを出力する画像処理装置であって、
    前記文字線画情報を入力する入力手段と、
    前記入力手段により入力された前記文字線画情報の中から、プリント出力後に機械認識処理がなされるであろう文字線画情報のフォントを、当該機械認識処理のための特定のフォントに変換する変換手段と
    を備えたことを特徴とする画像処理装置。
  10. 前記機械認識処理のためのプリント出力である機械認識処理モードのユーザ指定を認識する認識手段を更に備え、
    前記変換手段は、前記認識手段による認識から当該プリント出力後に機械認識処理がなされるものとしてフォントの変換を行うことを特徴とする請求項9記載の画像処理装置。
  11. 前記変換手段は、前記文字線画情報のフォントをボールドのフォントに変換することを特徴とする請求項9記載の画像処理装置。
  12. 前記変換手段は、前記文字線画情報のフォントを、前記機械認識処理を容易とするサイズに変換することを特徴とする請求項9記載の画像処理装置。
  13. 前記変換手段は、前記文字線画情報のフォントに強調処理を施すことを特徴とする請求項9記載の画像処理装置。
  14. 前記変換手段は、前記フォントの中の小さい記号についてサイズを拡大して出力することを特徴とする請求項9記載の画像処理装置。
  15. 入力された前記文字線画情報が色背景中にあるか否かを判断する手段を更に備え、
    前記文字線画情報が前記色背景中にあると判断される場合に、当該色背景の濃度を減ずることを特徴とする請求項9記載の画像処理装置。
  16. 入力された画像データに対して画像処理を施す画像処理方法であって、
    画像出力後にOCR処理が施されることを前提としたプリント画像を出力するためのOCRモードの指定情報を入力し、
    前記OCRモードの指定情報を入力した場合に、前記OCR処理に際して文字部が認識し易くなるように、通常の画像処理に代え特定の画像処理を施すことを特徴とする画像処理方法。
  17. 前記特定の画像処理は、入力された画像データの有する文字部のフォントを、OCR処理の認識がし易いフォントに変換して出力することを特徴とする請求項16記載の画像処理方法。
JP2005360487A 2005-12-14 2005-12-14 画像処理装置、および画像処理方法 Pending JP2007166287A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005360487A JP2007166287A (ja) 2005-12-14 2005-12-14 画像処理装置、および画像処理方法
US11/447,988 US20070133020A1 (en) 2005-12-14 2006-06-07 Image processing system and image processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005360487A JP2007166287A (ja) 2005-12-14 2005-12-14 画像処理装置、および画像処理方法

Publications (1)

Publication Number Publication Date
JP2007166287A true JP2007166287A (ja) 2007-06-28

Family

ID=38138954

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005360487A Pending JP2007166287A (ja) 2005-12-14 2005-12-14 画像処理装置、および画像処理方法

Country Status (2)

Country Link
US (1) US20070133020A1 (ja)
JP (1) JP2007166287A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11521365B2 (en) 2019-04-02 2022-12-06 Canon Kabushiki Kaisha Image processing system, image processing apparatus, image processing method, and storage medium

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4817994B2 (ja) * 2006-07-03 2011-11-16 キヤノン株式会社 データ管理システム
JP4529990B2 (ja) * 2007-03-30 2010-08-25 ブラザー工業株式会社 画像処理プログラム及び画像処理装置
US8467089B2 (en) * 2008-11-24 2013-06-18 Xerox Corporation Systems and methods for line width control and pixel retagging
US20130282600A1 (en) * 2012-04-23 2013-10-24 Sap Ag Pattern Based Audit Issue Reporting
JP5992956B2 (ja) * 2014-05-27 2016-09-14 京セラドキュメントソリューションズ株式会社 画像処理装置
CN107665087B (zh) * 2016-07-28 2021-03-16 夏普株式会社 图像显示装置、图像显示方法以及图像显示系统
US20190139280A1 (en) * 2017-11-06 2019-05-09 Microsoft Technology Licensing, Llc Augmented reality environment for tabular data in an image feed

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07160815A (ja) * 1993-12-02 1995-06-23 Hitachi Eng Co Ltd 輪郭強調による画像二値化処理方法及び装置
JPH11272257A (ja) * 1997-12-16 1999-10-08 Fuji Xerox Co Ltd 画像処理装置、画像出力装置、画像処理方法および画像処理プログラムを記録した記録媒体
JP2000316077A (ja) * 1999-04-28 2000-11-14 Canon Inc 画像データ格納装置及び方法及び記憶媒体
JP2001096872A (ja) * 1999-09-29 2001-04-10 Chescom International Co Ltd プリンタ装置および印刷物検査装置
JP2001253125A (ja) * 2000-03-10 2001-09-18 Canon Inc 画像処理システム及び画像処理方法
JP2002279346A (ja) * 2001-03-15 2002-09-27 Ricoh Co Ltd 画像処理装置、画像処理方法、記録媒体および文字認識装置
JP2003179768A (ja) * 2001-12-10 2003-06-27 Pfu Ltd 画像処理装置
JP2004227255A (ja) * 2003-01-22 2004-08-12 Mitsubishi Electric Corp 文書解析装置
JP2004326213A (ja) * 2003-04-22 2004-11-18 Fuji Oozx Inc 伝票作成方法およびそのシステム
JP2005071088A (ja) * 2003-08-25 2005-03-17 Canon Inc 画像処理装置、画像処理方法ならびにプログラム、記憶媒体

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0604685A1 (en) * 1992-12-28 1994-07-06 Océ-Nederland B.V. Method of modifying the fatness of characters
US6571011B1 (en) * 1995-06-06 2003-05-27 Apple Computer, Inc. Conversion of output device color values to minimize image quality artifacts
US6178011B1 (en) * 1998-03-24 2001-01-23 Hewlett-Packard Company Adaptive image resolution enhancement technology
US6470094B1 (en) * 2000-03-14 2002-10-22 Intel Corporation Generalized text localization in images
JP4057337B2 (ja) * 2002-04-24 2008-03-05 東芝テック株式会社 画像処理装置と画像形成装置
US7079686B2 (en) * 2002-08-20 2006-07-18 Lexmark International, Inc. Systems and methods for content-based document image enhancement
JP4401944B2 (ja) * 2004-12-08 2010-01-20 キヤノン株式会社 情報処理装置、情報処理方法ならびにプログラム

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07160815A (ja) * 1993-12-02 1995-06-23 Hitachi Eng Co Ltd 輪郭強調による画像二値化処理方法及び装置
JPH11272257A (ja) * 1997-12-16 1999-10-08 Fuji Xerox Co Ltd 画像処理装置、画像出力装置、画像処理方法および画像処理プログラムを記録した記録媒体
JP2000316077A (ja) * 1999-04-28 2000-11-14 Canon Inc 画像データ格納装置及び方法及び記憶媒体
JP2001096872A (ja) * 1999-09-29 2001-04-10 Chescom International Co Ltd プリンタ装置および印刷物検査装置
JP2001253125A (ja) * 2000-03-10 2001-09-18 Canon Inc 画像処理システム及び画像処理方法
JP2002279346A (ja) * 2001-03-15 2002-09-27 Ricoh Co Ltd 画像処理装置、画像処理方法、記録媒体および文字認識装置
JP2003179768A (ja) * 2001-12-10 2003-06-27 Pfu Ltd 画像処理装置
JP2004227255A (ja) * 2003-01-22 2004-08-12 Mitsubishi Electric Corp 文書解析装置
JP2004326213A (ja) * 2003-04-22 2004-11-18 Fuji Oozx Inc 伝票作成方法およびそのシステム
JP2005071088A (ja) * 2003-08-25 2005-03-17 Canon Inc 画像処理装置、画像処理方法ならびにプログラム、記憶媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11521365B2 (en) 2019-04-02 2022-12-06 Canon Kabushiki Kaisha Image processing system, image processing apparatus, image processing method, and storage medium

Also Published As

Publication number Publication date
US20070133020A1 (en) 2007-06-14

Similar Documents

Publication Publication Date Title
US7505174B2 (en) Image processing method, system and apparatus, and storage medium
US8423900B2 (en) Object based adaptive document resizing
US7692813B2 (en) Image processing apparatus and method, and storage medium
CN102404478B (zh) 图像形成装置及系统、信息处理装置、图像形成方法
JP4890974B2 (ja) 画像処理装置、及び画像処理方法
US6556311B1 (en) Luminance-based color resolution enhancement
JP2007166287A (ja) 画像処理装置、および画像処理方法
EP0772117A1 (en) Printer driver architecture for reducing band memory
JP4872860B2 (ja) 画像処理装置及び画像処理方法
JP2006262204A (ja) 画像処理装置及び画像処理方法
JP5499981B2 (ja) 画像処理装置
CN101090433B (zh) 图像形成装置和图像形成方法
KR100869284B1 (ko) 화상 처리 장치 및 화상 처리 방법
US10582088B2 (en) Information processing apparatus, method, and storage medium for causing printer driver to generate drawing command
US8259313B2 (en) Image processing apparatus, method, and computer-readable medium storing the program thereof
JP4797766B2 (ja) 画像処理装置、画像形成装置および画像処理方法
US20090244559A1 (en) Image rasterizing apparatus and image rasterizing method
US8390907B2 (en) Image-processing device, image-forming device, image-processing method, and computer readable medium
EP2860956B1 (en) Method for converting print data into a raster image
JP2019121870A (ja) 画像処理装置とその制御方法、及びプログラム
JP4217332B2 (ja) 画像処理装置及びその方法、コンピュータ可読メモリ
JP4306841B2 (ja) 画像処理装置及びその方法、コンピュータ可読メモリ
RU2452126C1 (ru) Устройство обработки изображения, способ обработки изображения и носитель информации
US20120140291A1 (en) System and method of printing micro-pictures for anti-counterfeiting and copy protection
US20130063483A1 (en) System and method to enable correction to application of substantially colorless material over identified text via segmentation

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100629

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100827

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110301

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110428

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110830