JP2007166287A

JP2007166287A - 画像処理装置、および画像処理方法

Info

Publication number: JP2007166287A
Application number: JP2005360487A
Authority: JP
Inventors: Hiroyoshi Kamijo; 裕義上條; Toru Misaizu; 亨美斉津
Original assignee: Fuji Xerox Co Ltd
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2005-12-14
Filing date: 2005-12-14
Publication date: 2007-06-28
Also published as: US20070133020A1

Abstract

【課題】人間の見た目の画質ではなく、ＯＣＲ処理という観点から見た高画質を達成し得る画像処理装置、画像処理方法を提供する。
【解決手段】入力された画像データに対して画像処理を施す画像処理部１０にて、画像出力後にＯＣＲ処理が施されることを前提としたプリント画像を出力するためのＯＣＲモードが指定されていることを認識し、通常の画像処理に代えてＯＣＲ処理のために有効な特定の画像処理をコントローラ１１およびエンジン制御部１２にて施す。
【選択図】図２

Description

本発明は、ホストコンピュータ等にて作成された文書を画像形成装置により印字出力するための画像処理を行う画像処理装置、および画像処理方法に関する。

従来、プリントサンプルをスキャナ（画像読取装置）にて読み込み、ラスタ画像をコード化する技術としてＯＣＲ（Optical Character Reader）がある。このＯＣＲでは、手書き文字や印字された文字などをスキャナで光学的に読み取り、予め記憶されたパターンと照合して文字情報を特定し、データとしての文字（文字データ）を入力している。

公報記載の従来技術として、文字として認識しなくても良い領域を文字領域として誤判定し、この誤判定された文字領域に対しても文字認識処理を実行してしまうという課題に対処したものが存在する（例えば、特許文献１参照。）。この特許文献１では、ＯＣＲさせる部分に原稿上マーカで色を塗り、その部分を認識させることで、領域分割の精度を高め、認識処理の効率を高める提案がなされている。
また、他の公報記載の技術として、写真部と文字部の画質両立を目的に、オブジェクト毎にＴａｇをつけて、オブジェクト毎にスクリーンを切り替える処理が行われている（例えば、特許文献２参照。）。この特許文献２に記載の技術によれば、それぞれの画像要素の持つ特性に適応した画像処理を行うことが可能となり、高画質な画像形成を行うことができる。

特開平１１−１９１１３６号公報特開平８−２３５３４６号公報

ここで、現状のＯＣＲ技術では、ドキュメントの文字情報を１００％コード化することは困難であり、コード化を良好に行えない様々な画像が存在する。ＯＣＲに不向きな画像としては、例えば、線画が混在するドキュメントや、薄い色で書かれた文字、低解像度情報の文字等がある。
他方、電子化の中でオリジナルの電子ドキュメントをやり取りすれば、わざわざ紙に出力（プリントアウト）してＯＣＲ処理しなくても済むとの考えもある。しかしながら、例えば電子文書に関する日本国の法律（例えば電子文書法）等により紙と電子の両方の原本が必要となるケースがあり、また、現状では、例えば交通費処理、領収書を貼って割印する等の紙を原本として採用する文化が根強く存在している。その結果、かかる紙に記載された文字を読み取ってデータとして入力する要求は依然として強く、プリントアウトした用紙に対するＯＣＲ処理の要求は非常に高い。

上記特許文献１に記載の技術は、読み取り領域を知る上での１つの提案とはなり得る。しかしながら、人手によりマーカを塗る手間が必要になるとともに、小さな文字が込み入った箇所でのマーキングミスが問題となる恐れがある。また、マーカを塗ったことで、文字と背景とのコントラストが取れなくなり、かえって誤認識の確率が高まることも予想される。更には、例えば国税局に納める納税証明書などのように、紙原稿がオリジナルとなる場合には、マーカでオリジナルを汚すことや加筆することができず、この技術を利用することができない。
また、現状、プリントサンプルとして、人間の見た目で高画質になる場合と、ＯＣＲ機能から見て高画質になる場合とは必ずしも一致しない。上記特許文献２の技術を採用することで、人間の見た目の高画質は達成できるが、コード化処理の観点から見て更に高画質化のための施策が必要となる。

本発明は、以上のような技術的課題を解決するためになされたものであって、その目的とするところは、人間の見た目の画質ではなく、機械認識機能という観点から見た高画質を達成し得る画像処理装置、画像処理方法を提供することにある。
また他の目的は、機械認識機能という観点から見た高画質を達成し得る特定モードを設け、後処理で例えばＯＣＲをかける予定がある場合に、予めプリント時にＯＣＲが判断し易い画像を出力することにある。

かかる目的のもと、本発明は、プリントサンプルとして、人間の見た目の高画質と機械認識機能からみた高画質は必ずしも一致しない点に着目し、人間の見た目の画質上には必ずしも好ましくないが、機械認識機能という観点からみた高画質を達成しうるモードを設けた。そして、後処理でＯＣＲ（Optical Character Reader）などの機械認識処理をかける予定がある場合は、プリント時にＯＣＲが判断しやすいように出力画像をエンハンスして出力している。即ち、本発明は、入力された画像データに対して画像処理を施す画像処理装置であって、画像出力後に機械認識処理が施されることを前提としたプリント画像を出力するための機械認識処理モードが指定されていることを認識する認識手段と、この認識手段により機械認識処理モードの指定が認識された場合に、通常の画像処理に代えて機械認識処理のための特定の画像処理を施す処理手段とを備えたことを特徴としている。

ここで、この認識手段により認識される機械認識処理モードは、画像出力後にＯＣＲ処理が施されることを前提とするモードであることを特徴とすることができる。
また、この処理手段は、機械認識処理が実行される箇所である文字部を機械認識し易くなるように加工することを特徴としている。
更にこの処理手段は、入力された画像データのプリントコマンドに応じたオブジェクト分離を実施し、このオブジェクト分離によって分離された文字部について画像濃度を飽和させ、または黒（１００％）一色に置き換えることを特徴としている。

ここで、この処理手段は、入力された画像データがラスタ画像である場合にエッジ抽出処理を行い、このエッジ抽出処理により抽出されたエッジ部に対して画像濃度を飽和させることで、濃度の低い文字のコード化処理を良好にすることを特徴としている。
また、この処理手段は、入力された画像データのプリントコマンドに応じたオブジェクト分離を実施し、このオブジェクト分離によって分離された線画部で指定されるエリアについて機械認識され難くなるように画像処理を施すことを特徴とすることができる。
更に、この処理手段は、線画部で指定されるエリアの濃度を、例えば白（０％）に置き換えるなど、減ずることを特徴とすることができる。
また更に、この処理手段は、線画部で指定されるエリアをスキャナの読み取り難い色に置き換えることを特徴としている。

他の観点から捉えると、本発明は、特定のフォントを有する文字線画情報に画像処理を施して画像データを出力する画像処理装置であって、文字線画情報を入力する入力手段と、この入力手段により入力された文字線画情報の中から、プリント出力後に機械認識処理がなされるであろう文字線画情報のフォントを、機械認識処理のための特定のフォントに変換する変換手段とを備えたことを特徴としている。

ここで、この機械認識処理のためのプリント出力である機械認識処理モードのユーザ指定を認識する認識手段を更に備え、変換手段は、認識手段による認識からプリント出力後に機械認識処理がなされるものとしてフォントの変換を行うことを特徴としている。
また、この変換手段は、文字線画情報のフォントをボールドのフォントに変換することを特徴とすることができる。
更に、この変換手段は、文字線画情報のフォントを、機械認識処理を容易とするサイズに変換することを特徴としている。例えば、小さいフォントを大きなフォントに変換することで、認識率を上げることができる。
また更に、この変換手段は、文字線画情報のフォントに強調処理を施すことを特徴とすることができる。
また、この変換手段は、フォントの中の小さい記号についてサイズを拡大して出力することを特徴とすることができる。例えば、句読点、小数点、カンマ、ダッシュ、ピリオドなどである。これらのサイズを拡大することで、ＯＣＲ処理に際して誤って認識される確率を大幅に減らすことが可能となる。

ここで、入力された文字線画情報が色背景中にあるか否かを判断する手段を更に備え、文字線画情報が色背景中にあると判断される場合に、この色背景の濃度を減ずることを特徴とすれば、文字線画情報の認識を助けることができる点で優れている。

一方、本発明を方法のカテゴリから捉えると、本発明は、入力された画像データに対して画像処理を施す画像処理方法であって、画像出力後にＯＣＲ処理が施されることを前提としたプリント画像を出力するためのＯＣＲモードの指定情報を入力し、このＯＣＲモードの指定情報を入力した場合に、ＯＣＲ処理に際して文字部が認識し易くなるように、通常の画像処理に代え特定の画像処理を施すことを特徴としている。ここで、この特定の画像処理は、入力された画像データの有する文字部のフォントを、ＯＣＲ処理の認識がし易いフォントに変換して出力することを特徴とすることができる。

本発明によれば、人間の見た目の画質ではなく、機械認識機能という観点から見た高画質を達成し得る画像処理装置、画像処理方法を提供することが可能となる。

以下、添付図面を参照し、本発明の実施の形態について詳細に説明する。
〔実施の形態１〕
図１は、本実施の形態が適用されるプリンタシステムの全体構成を示した図である。ここでは、入力された電子文書の情報を画像展開して用紙上に印刷する画像形成装置１と、この画像形成装置１に対して電子文書を提供するホストコンピュータであるクライアントＰＣ（パーソナルコンピュータ）２とが示されている。この画像形成装置１には、クライアントＰＣ２以外の、図示しない画像読み取り装置（ＩＩＴ）などから画像データが入力される場合がある。画像形成装置１は、ＯＣＲ（Optical Character Reader）の対象となるプリント画像を出力（プリントアウト）する。

この画像形成装置１は、例えばクライアントＰＣ２から出力された電子文書の画像データに対して所定の画像処理を施す画像処理部(ＩＰＳ：Image Processing System)１０と、電子写真方式を利用した所謂タンデム型のデジタルカラープリンタであるマーキングエンジン３０とを備えている。マーキングエンジン３０は、水平方向に一定の間隔を置いて並列的に配置される複数のエンジンからなる画像形成ユニット３１Ｙ,３１Ｍ,３１Ｃ,３１Ｋを備え、イエロー(Ｙ)、マゼンタ(Ｍ)、シアン(Ｃ)、黒(Ｋ)のトナー像を形成し、用紙上にトナー像を順次、転写している。この４つの画像形成ユニット３１Ｙ,３１Ｍ,３１Ｃ,３１Ｋは、夫々、静電潜像を形成してトナー像を担持させる像担持体(感光体)である感光体ドラム３２、感光体ドラム３２の表面を一様に帯電する帯電器３３、帯電器３３によって帯電された感光体ドラム３２を露光する露光器３４、露光器３４によって得られた静電潜像を現像する現像器３５を備えている。また、感光体ドラム３２の表面上に形成されたトナー像を用紙に転写させる転写ロール３６を備えている。そして、マーキングエンジン３０は、各画像形成ユニット３１Ｙ,３１Ｍ,３１Ｃ,３１Ｋの感光体ドラム３２と転写ロール３６とによって形成される転写位置に対して用紙を搬送する用紙搬送ベルト３７を備えている。また、用紙上に転写されたトナー像を定着させる定着器３８を備えている。

クライアントＰＣ２から入力された画像データは、画像処理部１０によって画像処理が施され、所定のインタフェースを介してマーキングエンジン３０に供給される。マーキングエンジン３０では、図示しない画像出力制御部から供給された同期信号等の制御信号に基づいて動作する。まず、イエロー(Ｙ)の画像形成ユニット３１Ｙは、帯電器３３により帯電された感光体ドラム３２の表面に、画像処理部１０から得られた画像信号に基づいて露光器３４によって静電潜像を形成する。その静電潜像に対して現像器３５によってイエロー(Ｙ)のトナー像を形成し、形成されたイエロー(Ｙ)のトナー像は、図の矢印方向に回動する用紙搬送ベルト３７上の用紙に転写ロール３６を用いて転写される。同様にして、マゼンタ(Ｍ)、シアン(Ｃ)、黒(Ｋ)のトナー像が各々の感光体ドラム３２上に形成され、用紙搬送ベルト３７上の用紙に転写ロール３６を用いて多重転写される。多重転写された用紙上のトナー像は、定着器３８に搬送されて、熱および圧力によって用紙に定着される。

次に、本実施の形態が適用される画像処理方法について説明する。
図２は、本実施の形態が適用されるプリンタシステムの機能構成を示すブロック図である。画像処理部１０は、大きくコントローラ１１とエンジン制御部１２とを備えている。コントローラ１１は、クライアントＰＣ２から送られてくるＰＤＬ（Page Description Language:ページ記述言語）をコマンド解釈するＰＤＬ解釈部２１と、ＰＤＬ指定の色信号（ＲＧＢ）からマーキングエンジン３０の色信号（ＹＭＣＫ）に変換する描画部２２とを備えている。また、描画部２２にて描画された中間コードをマーキングエンジン３０に適合した画像データにレンダリングするレンダリング部２３を備えている。
一方、エンジン制御部１２は、レンダリングされた画像に対してエッジ判定を行うエッジ判定部２４と、エッジ判定がなされた画像に対してスクリーン処理（２値化処理）を施すスクリーン部２５とを備えている。また、スクリーン部２５にてスクリーニングされた画像データにパルス幅変調を施すパルス幅変調部２６を備えている。パルス幅変調部２６によりパルス幅変調が施された画像データは、マーキングエンジン３０へ出力される。

ここで、本実施の形態では、画像形成装置１にてＯＣＲなどの機械認識用にプリント出力を行う場合に、「ＯＣＲモード」という特定モード（機械認識処理モード）を設定可能としている。このＯＣＲモードでは、プリント出力後のＯＣＲにおけるコード化処理が良好に行えるように、プリント出力時に画像加工（画像エンハンス）を施すものである。この画像加工は、画像形成装置１にて行う場合や、クライアントＰＣ２で行う場合がある。そして、画像形成装置１にあっては、例えば本体に設けられたコントロールパネル（図示せず）に、ユーザが選択可能なインタフェースを設け、このインタフェースを介してユーザからのＯＣＲモード指定を入力可能とする方法が挙げられる。また、クライアントＰＣ２にあっては、例えばプリント出力に関するアプリケーションの実行時にて印刷出力を指示する際に、ＯＣＲモードを選択可能とし、この選択を認識してＯＣＲモードへ移行する方法がある。

ここで、ＯＣＲモードが利用される態様としては、例えば交通費の精算書類をプリントアウトする場合が挙げられる。この精算書類では、交通費の額が所定の領域に記載された画像をプリントアウトし、このプリントアウト紙の空白部分に例えば領収書が貼り付けられる。この交通費の額だけを、プリントアウト後にＯＣＲで読み取る場合に、ＯＣＲモードで印刷することで、ＯＣＲの良好な読み取りが可能となる。また、ＯＣＲモード利用の他の態様として、例えば納税書や決算書の印刷、メールアドレスやＵＲＬの印刷など、広く応用することができる。

次に、前述したＯＣＲモード処理について詳述する。
図３は、本実施の形態のプリンタシステムにて実行されるＯＣＲモード処理を示したフローチャートである。ステップ１０１からステップ１０３まではクライアントＰＣ２にて実行される処理であり、ステップ１０４からステップ１１１までは、画像処理部１０において実行される処理である。
まず、例えばクライアントＰＣ２上で、ユーザによってなされたＯＣＲモード選択を認識する（ステップ１０１）。また、クライアントＰＣ２のプリンタドライバにて、アプリケーションからのコマンドをプリンタの描画コマンドであるＰＤＬ(ページ記述言語)に変換する（ステップ１０２）。このプリンタドライバにて変換されたＰＤＬの描画コマンドは、クライアントＰＣ２から画像処理部１０に送られる（ステップ１０３）。

この画像処理部１０では、ＰＤＬ解釈部２１にて、取得されるＰＤＬのコマンドが解釈される（ステップ１０４）。その後、描画部２２は、解釈されたＰＤＬにより指定される色信号（ＲＧＢ）を、マーキングエンジン３０の色信号（ＹＭＣＫ）に変換する（ステップ１０５）。ここで、色変換に際し、ステップ１０１でＯＣＲモードが指定されているときには、線画コマンド領域は画像信号を０にし、文字部領域は２５５に飽和させる（ステップ１０６）。尚、描画部２２にて描画する際には、ラスタ（イメージ）データはマーキングエンジン３０のエンジン解像度へ変換し、文字（テキスト）、グラフィックスはエンジン解像度として好ましいコードである中間コードに一旦、変換した後に描画することもできる。また、描画部２２では、描画する際に、コマンドに応じ、ラスタ（イメージ）/文字（テキスト）/グラフィックスにそれぞれオブジェクトＴａｇ（タグ）を付ける（ステップ１０７）。このＴａｇは各画素毎に付くものとする。

ここで、通常モードで動作しているときの文字部領域については、色の識別性（階調性）を考えて例えば３００線以下で印字する。また、ユーザによりＯＣＲモードが選択されているときの文字部領域については、ジャギーがコード化処理の妨げになるので、例えば６００線以上で印字させるようにＴａｇが付けられる。尚、ステップ１０６で文字部領域を飽和させているのでスクリーン線は関係ないと考えるが、階調補正用のＴＲＣ（tone reproduction control）処理が後段で実施されることから、線数は高いほど良い。尚、本実施形態では、スクリーニングはエンジン制御部１２のスクリーン部２５で行っているが、負荷分散によりコントローラ１１の描画部２２でスクリーニングを行うことも可能である。このようにしてコントローラ１１で処理された画像データとＴａｇデータとは、エンジン制御部１２に入力される。

エンジン制御部１２のエッジ判定部２４では、例えば３×３のエッジ抽出フィルタを用いてエッジ抽出が行われる（ステップ１０８）。ここで、通常モードの処理においては、エッジ部はオブジェクトに関わらず６００線のＴａｇに置き換え、エッジ部画像データには６００線用のγ補正をかける。また、このとき、非エッジ部はスルーされる。このように、オブジェクト分離を行い、かつエッジ判定を行う理由は、処理によってはＯＣＲ読み込み対象となる文字をラスタ画像で出力する場合もあり、また、オブジェクト判定が必ずしも１００％有効ではないことから、このエッジ判定を組み合わせで処理している。

ここで、ＯＣＲモードが選択されている場合には、エッジ判定部２４でエッジであると判定され、かつ１/２５５以上の信号のあるエリア（領域）の画像データを飽和させ、Ｔａｇを６００線に置き換える処理が行われる（ステップ１０９）。このようにしてＴａｇが付けられた画像データは、スクリーン部２５へ送られる。その後、スクリーン部２５では、Ｔａｇに応じたスクリーン処理が実行される（ステップ１１０）。例えば、エッジ部は６００線のスクリーンで処理され、非エッジ部はオリジナルのスクリーン（例えば、イメージは２００線、グラフィックスは１５０線、文字は３００線で処理される。そして、スクリーン処理された画像はパルス幅変調部２６へ入力される。スクリーン部２５でスクリーニングされた画像データについて、このパルス幅変調部２６にてパルス信号として変調され、パルス変調された画像データが、マーキングエンジン３０へ出力される（ステップ１１１）。画像データを取得したマーキングエンジン３０では、図１に示すような各構成要素によって用紙上へカラー画像が形成され、プリント出力がなされる（ステップ１１２）。

図４は、ポストスクリプト(PostScript)（登録商標）言語の描画コマンドからのオブジェクト分離例を示した図である。図４には、イメージの例５１、文字の例５２、グラフィックスの例５３が示されている。文字の例５２を取り上げて説明すると、”/Helvetica findfont 12 scale font setfont” は、フォントの設定であり、/Helvetica はフォントの名前、１２はポイント(1/72 inch) 単位の文字の大きさを示している。また、”288 720 moveto” は、位置の指定であり、原点は左下、単位はポイント(1/72 inch) を示す。288はＸ座標、720はＹ座標を示している。更に、”(ABC) show” は、カッコの中が表示する文字列、”show” がそれを表示させる命令を示している。描画部２２は、ＰＤＬ解釈部２１にて解釈（図３のステップ１０４参照）されたこれらのコマンドによって、オブジェクト分離を行う。

図５（ａ）,（ｂ）は、Ｔａｇおよび各オブジェクトの処理例を示した図である。図５（ａ）は通常モードの処理であり、図５（ｂ）はＯＣＲモードの処理を示している。それぞれ、矢印の左側がコントローラ１１側の処理を示し、矢印の右側がエンジン制御部１２側の処理を示している。図５（ａ）に示す通常モードでは、図３のステップ１０７に示すように、図４に示すようなＰＤＬのコマンドで分離されるイメージ、文字（テキスト）、グラフィックスに、Ｔａｇの００、０１、１０が付される。この図５（ａ）では、画像データは所定の色補正が施される。更に図５（ａ）に示すエンジン制御部１２側では、図３のステップ１０８に示したエッジ処理が行われ、エッジ部にＴａｇの１１が付される。このエッジの画像データには、γ強調が施され、前述のように６００線のスクリーン処理が施される。

一方、図５（ｂ）に示すＯＣＲモードの処理では、図３のステップ１０６に示すように、文字（テキスト）領域の画像信号が２５５に飽和される。また、このステップ１０６に示すように、描画コマンド領域の画像信号、即ち、グラフィックスの線画を構成する画像信号を所定濃度以下（例えば０（白））にする。エンジン制御部１２側では、図３のステップ１０８に示したエッジ処理が同様に行われ、エッジ部にＴａｇの１１が付される。このエッジ部の画像データは、２５５に飽和される。また、文字（テキスト）領域は、６００線のスクリーンが用いられる。これによって、ＯＣＲ処理にて読み取られる、または読み取られる可能性の高い領域について、コード化処理を行い易くすることができる。

このように、本実施の形態では、後にスキャンしコード化処理を施されることを前提とする画像データを出力する際の特定モードとして、ＯＣＲモードを設けた。そして、このＯＣＲモードでは、コード化処理が良好に行えるように、プリント出力時に画像加工（画像エンハンス）を施している。この画像加工では、送られてくるラスタ画像に対し、エッジ抽出処理を施し、エッジ部に対して画像濃度を飽和させている。これによって、例えば薄い文字に対するコード化処理を良好に行うことが可能となる。また、この画像加工では、プリントコマンドに応じてオブジェクト分離を実施し、文字部もしくは高線数（６００線以上）で指定されるエリアについては、黒（１００％）の１色に置き換えることができる。更に、この画像加工では、プリントコマンドに応じてオブジェクト分離を実施し、文字部もしくは高線数（６００線以上）で指定されるエリアについては、その画素濃度を飽和させることが可能である。

更に、本実施の形態では、プリントコマンドに応じてオブジェクト分離を実施し、線画部で指定されるエリアについては、その画素濃度を下げるように変えて印字させている。この画像濃度では、線画濃度は白（０％）に置き換える。
ここで、線画濃度は、例えばブルーや黄色のような、スキャナで読み取りにくい特定色に置き換えることも好ましい。また、この線画濃度の制御は、線画の幅に応じて、加工処理を切り替えることも有効である。例えば、帳票の線は白に置き換え、表の枠は強調する等である。更に、プリントコマンドに応じてオブジェクト分離を実施し、重ね合わせ文字エリアを検出し、背景部色を白に置き換えるように構成することもできる。特に、背景と文字とのコントラストの差が小さい場合に、背景部分を白に置き換えることは、コード化処理を良好に行うためには有効である。また更に、画像加工において、フォント（Font）を解釈し、句読点や小数点、ダッシュやピリオド、カンマなど、小さい記号の場合はサイズを拡大して出力することを特徴とすることもできる。このように、小さい記号を強調することで、これらの認識率を高めることが可能となり、ＯＣＲで読み取った後に、人手によって修正を施す等の後処理を軽減することが可能となる。特に小数点を、句読点やカンマなどと読み違えるか否かは、ＯＣＲの認識率に大きく影響する。したがって、これらの認識率を大幅に向上させることのできる本実施の形態の意義は大きい。

尚、ＯＣＲモードにて、文字だけを２４００線、線画を６００線、中間調を２００線程度とし、文字情報のみを高線数かつハイガンマ（Ｈｉ−γ）で印字させることも有効である。これによって、文字のつぶれを防ぎ、認識率を上げたＯＣＲ処理が可能となる。

〔実施の形態２〕
実施の形態１では、ＯＣＲ処理がし易いように、プリント出力時に画像処理部１０にて画像をエンハンスしている。実施の形態２では、クライアントＰＣ２側および/または画像処理部１０側にて、例えばフォントを変えることによってＯＣＲ用のプリント出力を実現する点に特徴がある。尚、実施の形態１と同様の機能については同様の符号を用い、ここではその詳細な説明を省略する。

図６は、実施の形態２におけるＯＣＲモード処理の流れを示すフローチャートである。この処理は、図２に示すクライアントＰＣ２のアプリケーション（プリンタドライバ）、または画像処理部１０にて実現できる。まず、画像処理部１０のコントローラ１１やクライアントＰＣ２のアプリケーションでは、ユーザによるＯＣＲモード選択を認識する（ステップ２０１）。そして、テキスト（文字）や線などの文字線画の画像データと、写真などの中間調の画像データとを分離する（ステップ２０２）。この分離では、例えば図４に示すようなコマンドによる分離が行われる。分離した結果として、文字線画か否かが判断される（ステップ２０３）。文字線画ではない場合には、処理が終了する。文字線画である場合には、例えば文字線画情報をラスタ情報に変換する際に、フォントの種類、フォントの大きさを変更する（ステップ２０４）。

このフォントの種類の変更としては、例えば通常より太くした書体であるボールドへ変更するものがある。また、例えば、明朝文字をＡｒｉａｌボールドのフォントに強制的に変換させて出力させることも好ましい。即ち、ＯＣＲ誤認識の例として文字のカスレが挙げられる。例えば、明朝文字は細線部分が多く、カスレが生じ易い。そこで、明朝文字などを、細線による表現の少ないボールドなどのフォントに変換して出力する。このように、ＯＣＲによる文字認識がし易いフォントで印字することによって、例えば、プリント出力に際して明朝文字の細線部分などにカスレが生じＯＣＲの誤認識が発生する、といったトラブル発生を未然に防止することができる。
また、ＯＣＲ認識に際して、文字が薄いと、二値化した場合に閾値以下となって認識できなくなる可能性がある。そこで、色文字の色を黒に置換して出力することも有効である。
更に、スキャナの解像度に対してフォントの文字が小さく、ＯＣＲの読み取りが正確に行われない場合がある。そこで、文字のフォントサイズを、例えば１０ポイントから１４ポイント等に変換して出力する方法も好ましい。

また、ステップ２０４のフォントの変更に加えて、またはこれに代えて、フォントの強調処理を実施する（ステップ２０５）。このフォントの強調処理としては、ＯＣＲさせたい文字の部分にアンダーラインを入れることや、ＯＣＲさせたい文字だけを抽出して赤い色の文字に変更する等が挙げられる。即ち、ＯＣＲさせたい部分が予め解っている場合に、このような強調処理を施す。このような強調処理が施されたプリント画像を読み込んで実際にＯＣＲ処理を行うことで、ＯＣＲ読み込み装置によるＯＣＲ箇所の認識が容易となる。その結果、ＯＣＲの処理効率を高めることができる。

更に、これらの処理に加えて、またはこれに代えて、フォントの周囲が色背景か否かが判断される（ステップ２０６）。色背景ではない場合には、処理が終了する。色背景である場合には、背景部の濃度を所定濃度以下(例えば白（０％））に変換し（ステップ２０７）、処理を終了する。このように背景部の濃度を所定濃度以下（例えば白（０％））に変換することで、ＯＣＲ処理に際して文字の読み込みが容易となり、ＯＣＲ認識結果を良好とすることができる。

尚、プリント出力後に機械認識処理がなされるであろう（なされると予想される）文字線画情報のフォントは、ＯＣＲモードの指定に加え、予め領域を指定してプリントアウトすることによって、より効果を高めることができる。例えば、決算書などでは、ＯＣＲの認識を必要とする領域が予め定まっている。従って、所定のアプリケーションによって、領域を指定して特定領域だけについてＯＣＲモードのプリントアウトを指定できるようにすれば、本実施の形態における効果をより高めることが可能となる。

このように、実施の形態２では、例えば文字線画情報をラスタ情報に変換する際、認識させる文字情報について、予め変換手段でフォントを変更している。このフォントの変更として、例えばフォントを予めボールドに変えておくことや、予めＯＣＲの読み込みに適した大きさにフォントサイズを変えておくことが挙げられる。また、フォントの変更または強調として、フォントにアンダーラインを入れておくことや、フォントの色を変えておくことも有効である。更に、色背景中の文字は背景部の濃度を所定濃度以下（例えば白（０％））に置換しておく。このように構成することで、従来技術のようにマーカを塗るといった面倒な処理が不要となり、マーキングミスによる誤認識も防止することができる。また、オリジナルの原稿を汚すことなく、ＯＣＲの認識率を向上させることが可能となる。

以上、詳述したように、本実施の形態（実施の形態１および２）では、人間の見た目の高画質ではなく、ＯＣＲ機能から見た高画質という概念を導入している。即ち、例えば人間の見た目の画質上は好ましくはないが、ＯＣＲ機能といった機械認識機能から見た高画質なプリント出力を達成し得るＯＣＲモードを設けた。更に言い換えると、紙に印字するときにＯＣＲの認識率を踏まえて印字する。そして、プリント出力後にＯＣＲをかける予定のある画像に対し、例えばユーザからのＯＣＲモードの選択を認識することで、ＯＣＲ機能から見た高画質処理を実行している。これによって、プリントアウトされた後の画像にＯＣＲ処理などの機械認識処理を施した場合に、認識率を向上させることが可能となり、ＯＣＲ処理の速度向上などを図ることが可能となる。

本実施の形態が適用されるプリンタシステムの全体構成を示した図である。本実施の形態が適用されるプリンタシステムの機能構成を示すブロック図である。本実施の形態のプリンタシステムにて実行されるＯＣＲモード処理を示したフローチャートである。ポストスクリプト言語の描画コマンドからのオブジェクト分離例を示した図である。（ａ）,（ｂ）は、Ｔａｇおよび各オブジェクトの処理例を示した図である。実施の形態２におけるＯＣＲモード処理の流れを示すフローチャートである。

符号の説明

１…画像形成装置、２…クライアントＰＣ（パーソナルコンピュータ）、１０…画像処理部(ＩＰＳ)、１１…コントローラ、１２…エンジン制御部、２１…ＰＤＬ解釈部、２２…描画部、２３…レンダリング部、２４…エッジ判定部、２５…スクリーン部、２６…パルス幅変調部、３０…マーキングエンジン

Claims

入力された画像データに対して画像処理を施す画像処理装置であって、
画像出力後に機械認識処理が施されることを前提としたプリント画像を出力するための機械認識処理モードが指定されていることを認識する認識手段と、
前記認識手段により前記機械認識処理モードの指定が認識された場合に、通常の画像処理に代えて前記機械認識処理のための特定の画像処理を施す処理手段と
を備えたことを特徴とする画像処理装置。
前記認識手段により認識される機械認識処理モードは、画像出力後にＯＣＲ（Optical Character Reader）処理が施されることを前提とするモードであることを特徴とする請求項１記載の画像処理装置。
前記処理手段は、機械認識処理が実行される箇所である文字部を機械認識し易くなるように加工することを特徴とする請求項２記載の画像処理装置。
前記処理手段は、入力された前記画像データのプリントコマンドに応じたオブジェクト分離を実施し、当該オブジェクト分離によって分離された文字部について画像濃度を飽和させ、または黒（１００％）一色に置き換えることを特徴とする請求項３記載の画像処理装置。
前記処理手段は、入力された前記画像データがラスタ画像である場合にエッジ抽出処理を行い、当該エッジ抽出処理により抽出されたエッジ部に対して画像濃度を飽和させることで、濃度の低い文字のコード化処理を良好にすることを特徴とする請求項２記載の画像処理装置。
前記処理手段は、入力された前記画像データのプリントコマンドに応じたオブジェクト分離を実施し、当該オブジェクト分離によって分離された線画部で指定されるエリアについて機械認識され難くなるように画像処理を施すことを特徴とする請求項１記載の画像処理装置。
前記処理手段は、前記線画部で指定されるエリアの濃度を減ずることを特徴とする請求項６記載の画像処理装置。
前記処理手段は、前記線画部で指定されるエリアをスキャナの読み取り難い色に置き換えることを特徴とする請求項６記載の画像処理装置。
特定のフォントを有する文字線画情報に画像処理を施して画像データを出力する画像処理装置であって、
前記文字線画情報を入力する入力手段と、
前記入力手段により入力された前記文字線画情報の中から、プリント出力後に機械認識処理がなされるであろう文字線画情報のフォントを、当該機械認識処理のための特定のフォントに変換する変換手段と
を備えたことを特徴とする画像処理装置。
前記機械認識処理のためのプリント出力である機械認識処理モードのユーザ指定を認識する認識手段を更に備え、
前記変換手段は、前記認識手段による認識から当該プリント出力後に機械認識処理がなされるものとしてフォントの変換を行うことを特徴とする請求項９記載の画像処理装置。
前記変換手段は、前記文字線画情報のフォントをボールドのフォントに変換することを特徴とする請求項９記載の画像処理装置。
前記変換手段は、前記文字線画情報のフォントを、前記機械認識処理を容易とするサイズに変換することを特徴とする請求項９記載の画像処理装置。
前記変換手段は、前記文字線画情報のフォントに強調処理を施すことを特徴とする請求項９記載の画像処理装置。
前記変換手段は、前記フォントの中の小さい記号についてサイズを拡大して出力することを特徴とする請求項９記載の画像処理装置。
入力された前記文字線画情報が色背景中にあるか否かを判断する手段を更に備え、
前記文字線画情報が前記色背景中にあると判断される場合に、当該色背景の濃度を減ずることを特徴とする請求項９記載の画像処理装置。
入力された画像データに対して画像処理を施す画像処理方法であって、
画像出力後にＯＣＲ処理が施されることを前提としたプリント画像を出力するためのＯＣＲモードの指定情報を入力し、
前記ＯＣＲモードの指定情報を入力した場合に、前記ＯＣＲ処理に際して文字部が認識し易くなるように、通常の画像処理に代え特定の画像処理を施すことを特徴とする画像処理方法。
前記特定の画像処理は、入力された画像データの有する文字部のフォントを、ＯＣＲ処理の認識がし易いフォントに変換して出力することを特徴とする請求項１６記載の画像処理方法。