JP2010128966A

JP2010128966A - 画像処理装置、画像読取装置及び画像形成装置

Info

Publication number: JP2010128966A
Application number: JP2008305162A
Authority: JP
Inventors: Akira Sakamoto; 晃阪本
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 2008-11-28
Filing date: 2008-11-28
Publication date: 2010-06-10

Abstract

【課題】認識すべき文字を含む対象領域を複数取得し、並列してパターンマッチングを行うことにより、パターンマッチングにおける所与時間を短縮させ、パターンマッチングの高速化を図ることが出来る画像処理装置、画像読取装置及び画像形成装置を提供する。
【解決手段】認識すべき文字を含む候補文字領域（対象領域）を複数一括して取得する第１読出しＤＭＡ部１０４ａ（一括取得手段）、及び前記候補文字領域に対してパターンマッチングを行うパターンマッチング部１０４ｅ（マッチング手段）を複数備え、第１読出しＤＭＡ部１０４ａによる一括取得に係る複数の候補文字領域に対して、複数のパターンマッチング部１０４ｅが夫々パターンマッチングを行う。
【選択図】図６

Description

本発明は、入力画像データに基づいてパターンマッチングを行い、文字を認識する画像処理装置、並びに該画像処理装置を備えた画像読取装置及び画像形成装置に関する。

従来、光学式文字読取装置（OCR : Optical Character Reader）のような文字認識装置では、一般的にパターンマッチング（又は照合）処理により文字認識を行う。パターンマッチング処理は、入力画像に基づき取得した、認識の対象となる文字を含む対象領域の特徴を示す入力特徴ベクトルと、あらかじめ辞書データとして登録された文字候補の特徴を示す辞書特徴ベクトルとのパターンマッチングを行い、その結果、前記入力特徴ベクトルと最も類似していると判断された辞書特徴ベクトルに対応する文字候補を、文字認識結果として決定するものである。このようなパターンマッチング処理は、一般的に負荷が大きく、多大な処理時間を要するので、様々な高速化手法が提案されている。

例えば、特許文献１では、各文字候補の特徴を示す辞書照合ベクトル（辞書特徴ベクトル）と、前記対象領域の特徴を示す入力照合ベクトル（特徴ベクトル）との内積を用いて一致度を判定することにより、演算量を減らし、パターンマッチング処理の高速化を図るパターン認識装置が開示されている。また、特許文献２では、１つの文字（対象領域）に対するパターンマッチングを行う処理ユニットを複数備えることで高速化を図るパターンマッチング回路が開示されている。
特開２００８−９７２７５号公報特開昭６１−５１２６０号公報

しかしながら、特許文献１のパターン認識装置では、パターンマッチング処理を行うパターンマッチング部が１つのみである構成であり、パターンマッチング処理すべき文字（対象領域）の数が多い場合は、入力画像データからの前記対象領域の取得に多大な処理時間が所要されるという問題がある。

また、特許文献２のパターンマッチング回路では、複数の処理ユニット夫々が、辞書データを格納した辞書メモリを持つように構成されており、全体として多くのメモリが必要とされるという問題がある。

本発明は、斯かる事情に鑑みてされたものであり、その目的とするところは、複数の対象領域を一括して取得する一括取得手段と、一括して取得された各対象領域に対してパターンマッチングを並列して行う複数のマッチング手段とを備え、複数の対象領域に対して並列してパターンマッチングを行うことにより、パターンマッチングにおける所要時間を短縮させ、パターンマッチングの高速化を図ることが出来る画像処理装置、画像読取装置及び画像形成装置を提供することにある。

本発明に係る画像処理装置は、入力画像から認識すべき文字を含む対象領域を取得し、該対象領域の特徴を示す特徴ベクトルと、予め記憶されている文字候補の特徴を示す辞書特徴ベクトルとのパターンマッチングを行い、文字を認識する画像処理装置において、複数の対象領域を一括して取得する一括取得手段と、一括して取得された各対象領域に対してパターンマッチングを並列して行う複数のマッチング手段とを備えていることを特徴とする。

本発明にあっては、前記一括取得手段によって、一括して取得された複数の対象領域は、前記複数のマッチング手段に夫々割り当てられ、各マッチング手段は、割り当てられた対象領域に係る特徴ベクトルと、前記辞書特徴ベクトルとに基づき、並列してパターンマッチングを行う。

本発明に係る画像処理装置は、前記辞書特徴ベクトルを取得し、前記複数のマッチング手段に夫々供与する供与手段を備えることを特徴とする。

本発明にあっては、前記供与手段が前記辞書特徴ベクトルを取得して前記複数のマッチング手段に夫々与え、前記辞書特徴ベクトルに基づき、前記複数のマッチング手段が複数の対象領域に対して並列してパターンマッチングを行う。

本発明に係る画像読取装置は、画像を読み取る画像読取手段と、該画像読取手段によって読み取られた画像から前記対象領域を取得し、該対象領域の特徴ベクトルと、前記辞書特徴ベクトルとのパターンマッチングを行い、文字を認識する前述の本発明のいずれか一つの画像処理装置とを備えていることを特徴とする。

本発明にあっては、前記画像処理装置は、前記画像読取手段によって読み取られた画像から認識すべき文字を含む対象領域を取得し、該対象領域の特徴を示す特徴ベクトルと、予め記憶されている文字候補の特徴を示す辞書特徴ベクトルとのパターンマッチングを行い、文字を認識する。

本発明に係る画像形成装置は、前述の本発明のいずれか一つの画像処理装置を備え、該画像処理装置による文字認識の結果に基づいて画像データを生成し、生成した画像データに応じて、シート上に画像を形成するように構成されていることを特徴とする。

本発明にあっては、入力画像に対して前記画像処理装置が文字認識を行い、前記画像処理装置による文字認識の結果に基づいて画像データが生成され、該画像データに応じて、シート上に画像が形成される。

本発明によれば、複数の対象領域を一括取得し、夫々の対象領域に対して夫々のマッチング手段が並列してパターンマッチングを行うので、パターンマッチングにおける処理時間を短縮させ、パターンマッチングの高速化を図ることが出来る。

以下、本発明に係る画像処理装置を備える画像形成装置を、コピー機能、印刷機能等を有するデジタル複合機に適用した形態について図面を用いて具体的に説明する。

（実施の形態１）
図１は本発明の実施の形態１に係る画像形成装置の要部構成を示すブロック図である。実施の形態１に係る画像形成装置は、制御装置８００、画像入力装置２００、画像処理装置１００、画像出力装置７００、記憶装置３００、記憶制御装置４００、通信装置６００及び操作パネル５００等のハードウェアを備え、全体としてデジタル複合機を構成している。

制御装置８００は、これらのハードウェアを制御するＣＰＵと、制御の際に必要なデータ等を一時的に保持するＲＡＭとを備えている。記憶装置３００は、例えば、不揮発性の半導体メモリであり、画像処理用の画像データ、ハードウェア各部を制御するための制御プログラム、パターンマッチング（照合）処理に用いられる文字候補の辞書特徴ベクトル、文字コード等の辞書データ、後述の候補文字領域（対象領域）の画定に係る入力特徴ベクトル（特徴ベクトル）及び前記辞書特徴ベクトルに基づき、類似度、文字判定等を行うための判定プログラム等を予め記憶している。

制御装置８００は必要に応じて記憶装置３００から制御プログラム、判定プログラム等をロードし、ロードした制御プログラム、判定プログラム等を実行することにより、装置全体を本発明に係る画像処理装置を備えた画像形成装置として動作させる。

また、操作パネル５００は、デジタル複写機の動作モードを設定するための設定ボタン、テンキー、及び液晶ディスプレイ等の表示部を備えている。

なお、記憶制御装置４００は、記憶装置３００へのデータの書き込み、読み出しの制御を行う。また、後述する文字認識処理部１の照合処理部１０４の第１読み出しＤＭＡ１０４ａ及び制御装置８００のＣＰＵへのデータ送出、又は第１読み出しＤＭＡ１０４ａ及び制御装置８００のＣＰＵから出力されたデータ、命令の受信制御を行う。

画像入力装置２００は、原稿の画像を光学的に読取る読取手段であり、読取用の原稿に光を照射する光源、例えばＣＣＤ（Charge Coupled Device）のようなイメージセンサ等を備えている。画像入力装置２００では、所定の読取り位置にセットされた原稿からの反射光像を当該イメージセンサに結像させ、ＲＧＢ（R : Red, G : Green, B : Blue）のアナログ電気信号を出力する。画像入力装置２００が出力したアナログ電気信号は画像処理装置１００に入力される。

通信装置６００は、画像処理装置１００にて処理した後の画像データを外部へ送信するネットワークカード、モデムなどの通信装置６００であり、例えば、前記画像データをメールに添付して設定された送信先に送信する。

画像出力装置７００は、画像処理装置１００から出力される画像データに基づいて用紙、ＯＨＰフィルム等のシート上に画像形成を行う。そのため、画像出力装置７００は、感光体ドラム、該感光体ドラムを所定の電位に帯電させる帯電器、外部から受付けた画像データに応じてレーザ光を発して感光体ドラム上に静電潜像を生成させるレーザ書込装置、感光体ドラム表面に形成された静電潜像にトナーを供給して顕像化する現像器、感光体ドラム表面に形成されたトナー像を用紙上に転写する転写器等（図示せず）を備えており、電子写真方式にて利用者が所望する画像をシート上に形成する。なお、レーザ書込装置を用いた電子写真方式により画像形成を行う他、インクジェット方式、熱転写方式、昇華方式等により画像形成を行う構成であってもよい。

画像処理装置１００は、画像入力装置２００を通じて入力されるアナログ電気信号を基にデジタル形式の画像データを生成し、画像の種類に応じた処理を施した後、出力用の画像データを生成する。生成した画像データは画像出力装置７００又は通信装置６００に出力される。

図２は本発明の実施の形態１に係る画像形成装置の画像処理装置１００の要部構成を示すブロック図である。

画像処理装置１００は、Ａ／Ｄ変換部２、シェーディング補正部３、入力階調補正部４、領域分離処理部５、色補正部６、黒生成下色除去部７、空間フィルタ処理部８、出力階調補正部９、階調再現処理部１０、圧縮処理部１１、文字認識処理部１及びデータ変換部１２を備えている。

画像入力装置２００にて読み取られた画像データのアナログ信号は、画像処理装置１００内を、Ａ／Ｄ変換部２、シェーディング補正部３、入力階調補正部４、領域分離処理部５、色補正部６、黒生成下色除去部７、空間フィルタ処理部８、出力階調補正部９、階調再現処理部１０の順で送られ、ストリームとして画像出力装置７００へ出力されるように構成されている。また、入力階調補正部４の後に分岐が行われており、入力階調補正部４からのデータは圧縮処理部１１及び文字認識処理部１を介して、データ変換部１２に送られ、通信装置６００に出力されるように構成されている。

Ａ／Ｄ（アナログ／デジタル）変換部２は、ＲＧＢのアナログ信号をデジタル信号に変換するもので、シェーディング補正部３は、Ａ／Ｄ変換部２より送られてきたデジタルのＲＧＢ信号に対して、画像入力装置２００の照明系、結像系、撮像系で生じる各種の歪みを取り除く処理を施すものである。

入力階調補正部４は、シェーディング補正部３から入力されたＲＧＢ信号（ＲＧＢの反射率信号）に対して、カラーバランスを整えると同時に、濃度信号等の画像処理装置１００に採用されている画像処理システムの扱い易い信号に変換する変換処理を施すものである。

領域分離処理部５は、ＲＧＢ信号より、入力画像中の各画素を文字領域、網点領域、写真領域の何れかに分離するものである。領域分離処理部５は、分離結果に基づき、画素がどの領域に属しているかを示す領域識別信号を、黒生成下色除去部７、空間フィルタ処理部８、及び階調再現処理部１０へ出力すると共に、入力階調補正部４から出力された入力信号をそのまま色補正部６に出力する。

色補正部６は、色再現の忠実化実現のために、不要吸収成分を含むＣＭＹ（Ｃ：シアン・Ｍ：マゼンタ・Ｙ：イエロー）色材の分光特性に基づいた色濁りを取り除く処理を行うものである。

黒生成下色除去部７は、色補正後のＣＭＹの３色信号から黒（Ｋ）信号を生成する黒生成、元のＣＭＹ信号から前記黒生成で得たＫ信号を差し引いて新たなＣＭＹ信号を生成する処理を行うものであって、ＣＭＹの３色信号はＣＭＹＫの４色信号に変換される。

黒生成処理の一例として、スケルトンブラックによる黒生成を行なう方法がある。この方法では、スケルトンカーブの入出力特性をｙ＝ｆ（ｘ）、入力されるデータをＣ、Ｍ、Ｙ、出力されるデータをＣ'、Ｍ'、Ｙ'、Ｋ'、ＵＣＲ（Under Color Removal）率をα（０＜α＜１）とすると、黒生成下色除去処理は以下の式（１）で表わされる。

空間フィルタ処理部８は、黒生成下色除去部７より入力されるＣＭＹＫ信号の画像データに対して、領域識別信号を基にデジタルフィルタによる空間フィルタ処理を行い、空間周波数特性を補正することによって出力画像のぼやけ及び粒状性劣化を防ぐように処理するものであって、階調再現処理部１０も、空間フィルタ処理部８と同様に、ＣＭＹＫ信号の画像データに対して、領域識別信号を基に所定の処理を施すものである。

例えば、領域分離処理部５にて文字に分離された領域は、特に黒文字或いは色文字の再現性を高めるために、空間フィルタ処理部８による空間フィルタ処理における鮮鋭強調処理で高周波数の強調量が大きくされる。同時に、階調再現処理部１０においては、高域周波数の再現に適した高解像度のスクリーンでの二値化または多値化処理が選択される。

また、領域分離処理部５にて網点に分離された領域に関しては、空間フィルタ処理部８において、入力網点成分を除去するためのローパス・フィルタ処理が施される。そして、出力階調補正部９では、濃度信号等の信号を画像出力装置７００の特性値である網点面積率に変換する出力階調補正処理を行った後、階調再現処理部１０で、最終的に画像を画素に分離して夫々の階調を再現できるように処理する階調再現処理（中間調生成）が施される。領域分離処理部５にて写真に分離された領域に関しては、階調再現性を重視したスクリーンでの二値化または多値化処理が行われる。

また、入力階調補正部４によって前記変換処理が行われたデータは、圧縮処理部１１に入力され、圧縮処理部１１では入力されるＲＧＢ信号に対して圧縮処理を行う。圧縮の方式としては例えばJPEG（Joint Photographic Experts Group）を使用する。また、文字認識処理部１では後述する候補文字領域に対する文字認識処理を行い、文字コード及び座標を出力する。データ変換部１２では、これらのデータからPDF（Portable Document Format）のように送信出力に適したデータフォーマットに変換し、例えば、操作パネル５００において、通称‘scan to e-mailモード’が選択されている場合、ネットワークカード又はモデム等の通信装置６００により、メールに添付されて設定された送信先に送信される。

上述したように各処理が施された画像データは、一旦記憶手段（例えば、記憶装置３００）に記憶され、所定のタイミングで読み出されて画像出力装置７００に入力される。画像出力装置７００は、例えば、電子写真方式又はインクジェット方式を用いた画像出力装置を挙げることができるが、これに限定されるものではない。尚、以上の処理は制御装置８００のＣＰＵにより制御される。また、ファクシミリの送信を行うときは、モデムにて、相手先との送信手続きを行って送信可能な状態が確保されると、所定の形式で圧縮された画像データ（スキャナで読み込まれた画像データ）をメモリから読み出し、圧縮形式の変更等必要な処理を施して、相手先に通信回線を介して順次送信する。

一方、ファクシミリを受信する場合、制御装置８００のＣＰＵは、通信手続きを行いながら相手先から送信されてくる画像データを受信して画像処理装置１００に入力し、画像処理装置１００では、受信した画像データを、圧縮／伸張処理部（図示せず）にて伸張処理を施す。伸張された画像データは、必要に応じて、回転処理、解像度変換処理等の処理が行なわれ、出力階調補正、階調再現処理が施された後、画像出力装置より出力される。また、ネットワークカード、ＬＡＮケーブルを介して、ネットワークに接続されたコンピュータ及び他のデジタル複合機とデータ通信を行なう。

図３は本発明の実施の形態１に係る画像形成装置の文字認識処理部１の要部構成を示すブロック図である。文字認識処理部１は信号変換部１０１、行切り出し部１０２、領域画定部１０３、照合処理部１０４及び文字判定部１０５を備えている。

図４は信号変換部１０１の要部構成を示すブロック図である。信号変換部１０１は無彩化処理部１０１ａ、ＭＴＦ補正処理部１０１ｂ及び２値化処理部１０１ｃを備えており、入力ＲＧＢ画像データを２値データへと変換する。

無彩化処理部１０１ａは、入力画像データがカラー画像であった場合に無彩化して、明度もしくは輝度信号に変換するための処理部である。例えば、Ｙ_j＝０．３０Ｒ_j＋０．５９Ｇ_j＋０．１１Ｂ_j（Ｙ_j：各画素の輝度値，Ｒ_j、Ｇ_j、Ｂ_j：各画素の色成分）の式により輝度Ｙを求める。尚、このような方法ではなく、ＲＧＢ信号をＣＩＥ１９７６Ｌ^*ａ^*ｂ^*信号（CIE : Commission International de l'Eclairage、Ｌ^*：明度、a^*, ｂ^*:色度）に変換しても良い。

ＭＴＦ補正処理部１０１ｂは、画像入力装置の空間周波数特性が機種ごとに異なることを吸収するために用いられる。ＣＣＤの出力する画像信号には、レンズ及びミラー等の光学部品、ＣＣＤの受光面のアパーチャ開口度、転送効率及び残像、物理的な走査による積分効果及び走査むら等に起因しＭＴＦの劣化が生じている。このＭＴＦの劣化により、読み込まれた画像がぼやけることになる。ＭＴＦ補正処理部１０１ｂは、適切なフィルタ処理（強調処理）を施すことにより、ＭＴＦの劣化により生じるぼやけを修復する処理を行う。また、後段処理に不要な高周波成分を抑制するためにも用いる。すなわち、図５に示すような混合フィルタを用いて強調及び平滑化処理を行う。

２値化処理部１０１ｃは、無彩化された画像データ（輝度値（輝度信号）又は明度値（明度信号））を所定閾値と比較することにより画像を２値化する。例えば、輝度値又は明度値が５０以下であれば黒画素（値は「１」）、５０より大きければ白画素（値は「０」）として判定する。

文字認識処理部１の行切り出し部１０２、信号変換部１０１により２値化された画像に対して、副走査座標単位で加算していき、ヒストグラムを生成する。そして、所定の閾値以上に連続するヒストグラム結果に係る領域を一つの行として切り出す。

領域画定部１０３は、行切り出し部１０２で切り出された行に対して、ラベリング処理を行い、候補文字領域（対象領域）を画定する。ラベリング処理とは、つながっているすべての画素（以下、連結成分と言う。）に同じラベル（番号）を付し、異なった連結成分には異なった番号を付する処理のことをいう。例えば、「い」の文字の場合、２つの連結成分を有し、夫々の連結成分は異なる番号が付される。

照合処理部１０４は複数の候補文字領域（対象領域）に対して並列して照合（パターンマッチング）を行う。詳しくは、照合処理部１０４は、領域画定部１０３により画定された候補文字領域を、一括して複数取得し、一括して取得された複数の候補文字領域を候補文字領域毎に切り抜き、切り抜かれた対象領域に正規化を施した後、特徴ベクトルを検出して該特徴ベクトルに基づいてパターンマッチングを行い、後述する類似度の算出を行う。尚、文字判定部１０５は照合処理部１０４によって算出された類似度に基づき、候補文字領域に係る文字の判定（文字認識）を行う。

図６は本発明の実施の形態１に係る画像形成装置の照合処理部１０４の要部構成を示すブロック図である。照合処理部１０４は第１読出しＤＭＡ部１０４ａ、領域切り抜き部１０４ｂ、正規化処理部１０４ｃ、入力特徴ベクトル格納部１０４ｄ、パターンマッチング部１０４ｅ（マッチング手段）及び類似度格納部１０４ｆを備えており、これらの各部（第１読出しＤＭＡ部１０４ａを除く。）は夫々複数設けられている。以下の説明においては、便宜上、前記各部を夫々４つずつ備えている場合を例として説明する。なお、照合処理部１０４は第２読出しＤＭＡ部１０４ｇ、辞書バッファ１０４ｈ及び辞書特徴ベクトル取得部１０４ｉ（供与手段）をさらに備えている。

第１読出しＤＭＡ部１０４ａ及び第２読出しＤＭＡ部１０４ｇは記憶装置３００から読み出すデータの開始アドレス、データ容量を指定して、記憶装置３００にデータ読み出しを要求することにより、記憶装置３００からデータを取得する。

第１読出しＤＭＡ部１０４ａは、複数の候補文字領域（対象領域）に対して並列してパターンマッチングによる類似度判定を行うため、複数の候補文字領域を一括して取得するように、データの開始アドレス、データ容量を指定する。換言すれば、第１読出しＤＭＡ部１０４ａは複数のパターンマッチング部１０４ｅで処理できるだけの数の候補文字領域を一括して取得する。従って、第１読出しＤＭＡ部１０４ａにより一括して取得される候補文字領域の数は、前記各部が、特にパターンマッチング部１０４ｅが、夫々幾つずつ設けられているかによって決められる。例えば、上述したように、前記各部を夫々４つずつ備えている場合は、第１読出しＤＭＡ部１０４ａは４つの候補文字領域を一括して取得する。尚、第２読出しＤＭＡ部１０４ｇは、辞書バッファ１０４ｈに空きがあれば、パターンマッチングに用いられる文字候補に係る辞書データを取得するように、前記辞書データの開始アドレス、データ容量を指定する。

第１読出しＤＭＡ部１０４ａにより一括して取得された複数の候補文字領域は候補文字領域毎に切り抜かれ、夫々の領域切り抜き部１０４ｂへ割り当てられる。

正規化処理部１０４ｃは、後述する辞書特徴ベクトルが８×８（画素）の２値画像で構成されているため、入力画像をこれと同じ容量に変換（正規化）して入力特徴ベクトルを得る。各正規化処理部１０４ｃの正規化によって得られた入力特徴ベクトルは、対応する入力特徴ベクトル格納部１０４ｄに夫々格納される。

辞書特徴ベクトル取得部１０４ｉ（供与手段）は辞書バッファ１０４ｈの空き状況を管理する。辞書バッファ１０４ｈに空きがあれば、次に用いるべき文字候補に係る辞書データを第２読出しＤＭＡ部１０４ｇに要求する。これにより、記憶装置３００に格納されている辞書データ（辞書特徴ベクトル群）を辞書バッファ１０４ｈに格納できる。なお、辞書特徴ベクトル取得部１０４ｉは、辞書バッファ１０４ｈに格納された辞書データを並列して複数のパターンマッチング部１０４ｅに供与し、複数のパターンマッチング部１０４ｅは同期して辞書データを取得することが出来る。

図７は特徴ベクトルの一例を示す例示図である。前記特徴ベクトルとは、８×８の画素の夫々を「０」又は「１」で示した矩形の６４個の成分（画素）からなるベクトルである。記憶装置３００には、夫々の文字コードと、前記ベクトルとを対応付けた辞書データが格納されている。

図８は「あ」、「い」、「う」の文字コード夫々に対応した辞書特徴ベクトルの一例を示す例示図である。８×８の画素の夫々において、文字部分及び余白部分が夫々「１」又は「０」で表示されている。また、フォントの違いも加味して、夫々の文字コードに対応して複数の特徴ベクトルを対応付けてもよい。以下の説明においては、説明の便宜上、前記辞書データは「あ」、「い」、「う」の文字の辞書特徴ベクトルのみを有するものとする。実際上は、多数の文字、多数のフォントがあるため、一般的に辞書の容量は大きくなり、辞書バッファ１０４ｈに全ての辞書データを格納できなくなる。そのため、本発明の実施の形態１に係る画像形成装置は、すべての辞書データは記憶装置３００に格納し、パターンマッチングに必要なタイミングで必要な容量の辞書データを随時取得し、パターンマッチングを行うように構成されている。

パターンマッチング部１０４ｅでは、入力特徴ベクトル格納部１０４ｄに格納された入力特徴ベクトル、及び辞書特徴ベクトル取得部１０４ｉによって取得された辞書特徴ベクトルに基づき、パターンマッチング及び類似度（match）の算出を行う。以下、前記パターンマッチング及び類似度の算出について詳しく説明する。

まず、前記入力特徴ベクトルの画素をx_i(i=０〜６３)、前記辞書特徴ベクトルの画素をy_i(i=０〜６３)とし、以下の式（２）、式（３）及び式（４）によって、一つの候補文字領域の入力特徴ベクトルの総数（sum_in）と、一つの文字候補の辞書特徴ベクトルの総数（sum_dic）と、入力特徴ベクトル及び辞書特徴ベクトルの内積（inner_product）とを、夫々算出する。

これらの式によって得られた結果において、入力特徴ベクトルに対する一致割合（ratio_sum_in）、及び辞書特徴ベクトルに対する一致割合（ratio_sum_dic）は夫々以下のように算出することが出来る。

このようにして得られた入力特徴ベクトルに対する一致割合及び辞書特徴ベクトルに対する一致割合を、以下の式（７）によって掛け合わせた結果を類似度（match）とする。以上のような手順によって、各パターンマッチング部１０４ｅにて得られた類似度は、夫々の類似度格納部１０４ｆに格納される。

以下、本発明の実施の形態１に係る画像形成装置の文字認識作用について説明する。図９及び図１０は本発明の実施の形態１に係る画像形成装置の文字認識作用における、ＣＰＵの処理手順を示すフローチャートである。説明の便宜上、以下においては、図１１に示すように、「あ」、「い」、「う」の３つの文字が夫々２行に書かれた原稿が、画像入力装置２００によって読み取られた場合の画像データを例として説明する。

画像入力装置２００にて読み取られた画像データ（ＲＧＢ画像）のアナログ信号は、画像処理装置１００のＡ／Ｄ変換部２、シェーディング補正部３及び入力階調補正部４を介して文字認識処理部１に入力される。

文字認識処理部１に前記画像データが入力された場合、ＣＰＵは入力された前記画像データを２値データへと変換するように信号変換部１０１に指示する（ステップ１０１）。

ＣＰＵは、信号変換部１０１により２値化された画像データに基づき、文字認識の対象となる文字が含まれた領域を一つの行として切り出すように行切り出し部１０２に指示する（ステップ１０２）。詳しくは、図１２に示すように、行切り出し部１０２が、２値化された画像データを副走査座標単位で加算していき、ヒストグラムを生成する。そして、所定の閾値（例えば４）以上副走査方向に「１」の値が連続するヒストグラム結果に係る領域（図１２中ΔＧ１、ΔＧ２）を一つの行として切り出す。図１２の例においては、副走査座標２〜９、１５〜２２がその条件を満たしており、行として切り出される。また、文字の上端及び下端部分ではヒストグラム結果が小さくなる可能性があるので、行切り出し範囲を少し広めにしても良い。つまり、図１２の例の場合、副走査座標１〜１０、１４〜２２を行として切り出しても良い。以下、説明の便宜上、副走査座標２〜９までの領域（ΔＧ１）を切り出した場合を例として説明する。

次いで、ＣＰＵは、行切り出し部１０２により切り出された領域（行）の画素に対するラベリング処理を領域画定部１０３に指示する（ステップ１０３）。以下、ラスター走査方式の８連結による連結関係に基づいて、前記領域の左上から右下（図面視）方向へラベリング処理が行われる場合を例として、ラべリング処理の方法を詳しく説明する。ラスター走査方式の８連結とは、図１３に示すような、注目画素（ｆ_ij）と４つの隣接画素との関係に基づき、ラベル（番号）付する方式である。以下の説明においては、ラスター走査方式の８連結による連結関係に基づく場合を例として説明するが、これに限るものでなく、ラスター走査方式の４連結による連続関係の場合であっても良い。

領域画定部１０３は、（１）‐注目画素（ｆ_ij）が黒画素（値が「１」）でなければ「０」をラべリングする。（２）‐注目画素が黒画素（値が「１」）であれば、図１３に示す隣接画素との連結関係を満たしているか判定する。（３）‐（２）で図１３の連結関係を満たしており、連結関係内（隣接画素）のラベルが１種類であれば、そのラベルを割り付ける。（４）‐（２）で図１３の連結関係を満たしており、連結関係内のラベルが複数の種類であれば、その中で最も若い番号のラベルを割り付け、連結関係内の他のラベルもその中で最も若い番号のラベルに変更する（例えば、図１４のような場合は、注目画素のラベルは３になると共に、ラベル９についても３に変更する）。（５）‐（２）で図１３の連結関係を満たしていなければ新規ラベルを割り付ける（ラベルの値は０以外）。このようにして、図１２のΔＧ１に係る領域に対してラべリング処理を行った結果を図１５に示す。各文字の連結成分毎に１から５までの番号によってラべリングされている。例えば、一つの連結成分を有する「あ」の文字は一つの番号が付され、２つの連結成分を有する「い」の文字は、夫々「２」及び「４」の番号が付されている。

次いで、ＣＰＵは領域画定部１０３に座標特定を指示する（ステップ１０４）。領域画定部１０３は、図１２のΔＧ１に係る領域に対するラべリング処理の結果に基づき、各連結成分を囲む最少の矩形領域に係る主走査座標及び副主走査座標を特定する。座標特定の結果を図１６に示す。「１」から「５」までの各連結成分を囲む最少の矩形領域が、最小座標（MIN_X、MIN_Y）及び最大座標（MAX_X、MAX_Y）として特定されている。

また、ＣＰＵは領域画定部１０３に候補文字領域の画定を指示する（ステップ１０５）。ＣＰＵの指示に応じて、領域画定部１０３は照合（文字認識）の対象となるべき文字が含まれた候補文字領域（対象領域）を画定する。

詳しい画定方法について説明する。（１）図１６のMIN_Xが小さい方から順に注目する矩形領域とし、これを候補文字領域（対象領域）とする。（２）注目する矩形領域のMIN_X , MAX_X に対して、他の矩形領域内のいずれかの主走査座標ｘが、「MIN_X＜ｘ＜MAX_X＋Dist」を満たしていれば、斯かる矩形領域の組み合わせを候補文字領域とする。ここで、Distは、他の矩形領域との組み合わせを候補文字領域として画定する際の探索距離を示しており、例えば、行切り出し時の副走査座標の範囲（８：副走査座標２〜９）を用いる。このような候補文字領域の画定の結果を図１７に示す。候補番号「１」から「１０」までの候補文字領域が画定されている。一方、番号「４」と「３」のみの場合も上記の画定方法の結果として得られるが、図１８に示すような候補文字領域となり、番号「５」の連結成分の一部も含んでいるため、この組み合わせは画定結果から排除される。なお、この画定結果は、記憶装置３００に記憶される。

照合処理部１０４では、このようにして得られた各候補文字領域と、記憶装置３００に予め記憶されている辞書データ（文字候補の辞書特徴ベクトル）とのパターンマッチングを行う。

次いで、ＣＰＵは「Ｘ」を「０」とし（ステップ１０６）、「Ｙ」を「Ｘ＋４」とし（ステップ１０７）、候補番号「Ｘ＋１」から「Ｙ」までの複数の候補文字領域の一括取得を、照合処理部１０４の第１読出しＤＭＡ部１０４ａに指示する（ステップ１０８）。記憶装置３００に記憶された前記画定結果に基づき、第１読出しＤＭＡ部１０４ａは、４つ（「１」〜「４」）の候補文字領域を一括取得する。また、このように一括取得された４つの候補文字領域は切り抜かれ、４つの切り抜き部１０４ｂ，１０４ｂ，１０４ｂ，１０４ｂに夫々割り当てられる（ステップ１０９）。

このような、ステップ１０８及びステップ１０９の処理を詳しく説明する。図１９、図２０及び図２１はステップ１０８及びステップ１０９を説明するための説明図である。
上述したように、第１読出しＤＭＡ部１０４ａにより一括して取得される候補文字領域の数は、切り抜き部１０４ｂ、正規化処理部１０４ｃ等が夫々幾つずつ設けられているかによって決められるので、本発明の実施の形態１に係る画像形成装置において、４つずつ設けられており、第１読出しＤＭＡ部１０４ａは、前記画定の結果に基づき、４つの候補文字領域を含む領域を一括取得する。また、候補文字領域は候補番号「１」から「１０」まで１０個であるので、候補番号「１」〜「４」、「５」〜「８」、「９」〜「１０」の３回に分けて、前記２値化された画像データから一括取得を行う。実質上は、一回目の一括取得の後、パターンマッチングが行われてから、次回の一括取得が行われるが、説明の便宜上、以下においては、一括取得の処理についてのみ説明する。

１回目の候補文字領域の一括取得では、候補番号「１」〜「４」の候補文字領域が含まれる、（MIN_X,MINY）=（３,２）及び（MAX_X,MAXY）=（２２,９）の座標によって特定される矩形領域を取得する。その後、一括取得された前記矩形領域から、候補番号「１」〜「４」の候補文字領域に係る「候補矩形１」〜「候補矩形４」が夫々４つの切り抜き部１０４ｂ，１０４ｂ，１０４ｂ，１０４ｂに夫々割り当てられる（図１９参照）。

２回目の候補文字領域の一括取得では、候補番号「５」〜「８」の候補文字領域が含まれる、（MIN_X,MINY）=（２１,２）及び（MAX_X,MAXY）=（３４,９）の座標によって特定される矩形領域が取得され、候補番号「５」〜「８」の候補文字領域に係る「候補矩形５」〜「候補矩形８」が夫々４つの切り抜き部１０４ｂ，１０４ｂ，１０４ｂ，１０４ｂに夫々割り当てられる（図２０参照）。

３回目の候補文字領域の一括取得では、候補番号「９」〜「１０」の候補文字領域が含まれる、（MIN_X,MINY）=（２７,２）及び（MAX_X,MAXY）=（３４,９）の座標によって特定される矩形領域が取得され、候補番号「９」〜「１０」の候補文字領域に係る「候補矩形９」〜「候補矩形１０」が夫々２つの切り抜き部１０４ｂ，１０４ｂに夫々割り当てられる（図２１参照）。以上の処理によって「候補矩形１」から「候補矩形１０」までが得られる。

次いで、前記辞書ベクトルと同じ容量に変換し、対象となる候補矩形の入力特徴ベクトルを得るために、正規化処理が行われる。ここまでは、候補番号「１」〜「４」の候補文字領域に係る「候補矩形１」〜「候補矩形４」が得られており、ＣＰＵは、前記「候補矩形１」〜「候補矩形４」に対する正規化を、正規化処理部１０４ｃに指示する（ステップ１１０）。前記正規化処理とは、候補矩形の主走査サイズ、副走査サイズをそれぞれ８で割った値を座標が増加する毎に加算していき、その整数部分の座標の値を正規化後の入力特徴ベクトルとするものである。

以下、正規化について、「候補矩形１」〜「候補矩形３」を例として詳しく説明する。図２２、図２３及び図２４は、正規化処理を説明するための説明図である。
候補矩形１の正規化では、候補矩形１（画素）が８×８であるため、正規化後の入力特徴ベクトルも同じものとなる（図２２参照）。候補矩形２の正規化では、主走査サイズが１４であることから、１４／８＝１．７５ずつ対応する候補矩形２の座標を加算する（整数部分のみを使用する）。その結果、正規化後の主走査座標は、０、１、３、５、７、８、１０、１２が夫々対応することとなる（図２３参照）。また、候補矩形３の正規化では、主走査サイズが２であることから、２／８＝０．２５ずつ対応する候補矩形３の座標を加算する。その結果、正規化後の主走査座標は、０、０、０、０、１、１、１、１が夫々対応することとなる（図２４参照）。なお、正規化処理部１０４ｃの正規化によって得られた各入力特徴ベクトルは夫々対応する入力特徴ベクトル格納部１０４ｄに格納される。

以降、得られた各候補矩形の入力特徴ベクトルと、前記辞書特徴ベクトルとに基づくパターンマッチング及び前記類似度算出が行われるが、これに先立って文字候補の辞書特徴ベクトルの取得を行う。

ＣＰＵは、辞書特徴ベクトル取得部１０４ｉに指示し、辞書特徴ベクトルを取得して各パターンマッチング部１０４ｅに供与する（ステップ１１１）。辞書特徴ベクトル取得部１０４ｉは、記憶装置３００からの辞書特徴ベクトルの取得を第２読出しＤＭＡ部１０４ｇに求め、辞書バッファ１０４ｈに辞書特徴ベクトルが格納される。また、辞書特徴ベクトル取得部１０４ｉは、前記辞書特徴ベクトルを各パターンマッチング部１０４ｅに並列して供与する。従って、各パターンマッチング部１０４ｅが同じ辞書特徴ベクトルを同期して取得することができ、全体としては、辞書データ（辞書特徴ベクトル）へのアクセスを１／Ｎに減少させることが出来る。

次いで、ＣＰＵはパターンマッチングに基づく類似度の算出を、各パターンマッチング部１０４ｅに指示する（ステップ１１２）。ＣＰＵの指示に応じて、各パターンマッチング部１０４ｅは、対応する入力特徴ベクトル格納部１０４ｄに格納されている入力特徴ベクトル及び取得した前記辞書特徴ベクトルに基づき、パターンマッチング及び類似度算出の処理を行う。該処理は、上述したように、式（２）から式（４）までを用い、「sum_in」、「sum_dic」及び「inner_product」を算出し、更に、これらを式（５）及び式（６）に代入して「ratio_sum_in」及び「ratio_sum_dic」を算出し、「ratio_sum_in」及び「ratio_sum_dic」を式（７）に代入して類似度（match）を算出する処理である。

図２５は類似度の算出過程の一例を示す例示図である。図２５には、「候補矩形１」に係る入力特徴ベクトルにおける類似度算出過程を示している。これは、「あ」、「い」、「う」の文字候補の辞書特徴ベクトルを取得し、「候補矩形１」に係る入力特徴ベクトルとのパターンマッチングを行った結果である。例えば、「候補矩形１」に係る入力特徴ベクトルの「sum_in」、「sum_dic」及び「inner_product」は夫々２９、２８及び２７であり、「ratio_sum_in」、「ratio_sum_dic」及び類似度は夫々０．９３１０、０．９６４３及び０．８９７８であることが見て取れる。図２６は全ての候補矩形に係る入力特徴ベクトルに対する類似度算出によって得られた結果を示す図表である。なお、図２６では、各候補矩形と、該候補矩形に含まれる連結成分（ラベル）との関係を合わせて示している。なお、夫々のパターンマッチング部１０４ｅでの類似度算出によって得られた結果は、対応する類似度格納部１０４ｆに夫々格納される。

ここで、類似度（match）を入力特徴ベクトルに対する一致割合（ratio_sum_in）、及び辞書特徴ベクトルに対する一致割合（ratio_sum_dic）を掛けたもので定義した理由は、何れか一方で類似度を定義した場合、誤って類似度を高くしてしまう虞があるからである。図２７は誤った類似度（match）算出の一例を示す例示図である。

例えば、「候補矩形１０」の場合、正規化後には入力特徴ベクトルはすべて「１」となるが、このとき、「ratio_sum_dic」は常に1.0000となり、どの辞書特徴ベクトルとも類似度が高くなってしまう。また、図２７に示すような入力特徴ベクトルであると、例えば、文字候補「あ」の辞書特徴ベクトルでは前記入力特徴ベクトルに対する「ratio_sum_in」が高くなり、誤った類似度が算出される。このような誤った類似度の算出は入力特徴ベクトルの「１」の数が少ない場合に発生しやすくなる。以上のことから、類似度（match）を「ratio_sum_in」と「ratio_sum_dic」とを掛けたもので定義している。

次いで、ＣＰＵは、前記「Ｙ」が「１０」であるか否かを判定する（ステップ１１３）。ＣＰＵが前記「Ｙ」が「１０」であると判定した場合（ステップ１１３：ＹＥＳ）、処理はステップ１１４に進む。一方、ＣＰＵが前記「Ｙ」が「１０」でないと判定した場合（ステップ１１３：ＮＯ）、処理はステップ１１５に進む。

ここまでの処理では、前記「Ｙ」は「４」であるので、ＣＰＵは前記「Ｙ」が「１０」でないと判定し、処理はステップ１１５に進む。ステップ１１５にて、ＣＰＵは「Ｙ」（「４」）を「Ｘ」に代入し、「Ｘ＋４」が「１０」未満であるか否かを判定する（ステップ１１６）。

ＣＰＵは、「Ｘ＋４」が「１０」未満であると判定した場合（ステップ１１６：ＹＥＳ）、処理はステップ１０７に戻る。一方、「Ｘ＋４」が「１０」未満でないと判定した場合（ステップ１１６：ＮＯ）、処理はステップ１１７を介してステップ１０８に戻る。

ここまでの処理では、「Ｘ＋４」は「８」であり、「１０」未満である。従って、処理はステップ１０７に戻り、ステップ１０７からステップ１１２までの処理が再び行われる。つまり、「５」〜「８」の候補文字領域に対する一括取得、領域切り抜き及び正規化処理等が行われる。これらのステップに対しては、上述したものと同様であり、詳しい説明を省略する。以降、ＣＰＵは、「Ｙ」が「１０」であるか否かを判定する（ステップ１１３）。今回「Ｙ」は「８」であり、ステップ１１５を介してステップ１１６に進む。

上記したように、「Ｙ」は「８」であるので、ＣＰＵは「Ｘ＋４」が「１０」未満でないと判定し（ステップ１１６：ＮＯ）、ステップ１１７に進む。次いで、ＣＰＵは「Ｙ」に「１０」を代入し（ステップ１１７）、「９」〜「１０」の候補文字領域の一括取得を照合処理部１０４の第１読出しＤＭＡ部１０４ａに指示する（ステップ１０８）。

以降、ステップ１０９からステップ１１２までの処理が再び行われる。これらのステップに対しては、上述したものと同様であり、詳しい説明を省略する。

次いで、ＣＰＵは「Ｙ」が「１０」であるか否かを判定する（ステップ１１３）。今回「Ｙ」は「１０」であり、ＣＰＵは「Ｙ」が「１０」であると判定する（ステップ１１３：ＹＥＳ）。ＣＰＵは、各類似度格納部１０４ｆに格納されている類似度に基づく文字の判定（認識）を、文字判定部１０５に指示する（ステップ１１４）。ＣＰＵの指示に応じて文字判定部１０５は、候補番号「１」から「１０」までの候補文字領域に対する文字の判定を行う。

以下、前記文字の判定手順について詳しく説明する。図１６に示すラベリング結果のＭＩＮ＿Ｘの小さい順に、換言すれば、図１５において図面視左側から、各候補文字領域に対する文字の判定を行う。従って、１、２、４、５、３のラベル（番号）順に、各ラベルを含む候補文字領域に対する文字の判定が行われる。

文字判定部１０５は、まずラベル１に対して文字判定を行う。ラベル１を含む候補文字領域は候補１及び候補２であるため、この中から最も高い類似度のものを選択する。候補１及び候補２の中では、候補１と、文字候補「あ」との類似度が最も高いので、候補１は「あ」であると判定する。そして、文字候補「あ」の文字コードと共に、候補１の候補文字領域を特定する最小・最大座標（MIN_X, MIN_Y, MAX_X, MAX_Y）=（３,２,１０,９）を出力する。

次いで、文字判定部１０５は、ラベル２について文字判定を行う。ラベル２は候補３及び候補４に含まれており、この中から最も高い類似度のものを選択する。（候補２についてはすでにラベル１が文字として確定しているため除外される。）候補３及び候補４の中では、ラベル２と４の組み合わせである候補４と、文字候補「い」との類似度が最も高いので、候補４は「い」であると判定する。そして、文字候補「い」の文字コードと共に、候補４の候補文字領域を特定する最小・最大座標（MIN_X, MIN_Y, MAX_X, MAX_Y）=（１５,２,２２,９）を出力する。

次いで、文字判定部１０５は、ラベル４について文字判定を行う。しかし、ラベル４については、既に候補４を構成するものとして文字判定が行われているので、次のラベル５について文字判定を行う。ラベル５は候補８及び候補９に含まれており、この中から最も高い類似度のものを選択する。（候補６及び候補７についてはラベル４が含まれていることから除外される。）候補８及び候補９の中では、ラベル５と３の組み合わせである候補９と、文字候補「う」との類似度が最も高いので、候補９は「う」であると判定する。そして、文字候補「う」の文字コードと共に、候補９の候補文字領域を特定する最小・最大座標（MIN_X, MIN_Y, MAX_X, MAX_Y）=（２７,２,３４,９）を出力する。

なお、ラベル５の次にはラベル３について文字判定が行われるが、ラベル３については、既に候補９を構成するものとして文字判定が行われているので除外され、文字判定は終了する。

本発明に係る画像処理装置、及び該画像処理装置を備える画像形成装置は、上述したような照合処理部１０４を有するので、パターンマッチング・類似度判定（文字認識）の高速化を図ることが出来る。例えば、本発明に係る画像形成装置（画像処理装置）では、図１９に示すように、１回目の候補文字領域の一括取得では前記「候補矩形１」〜「候補矩形４」を一括取得するが、この際の第１読出しＤＭＡ１０４ａによって取得されるデータ量は２０×８＝１６０画素分である。それに対して、「候補矩形１」〜「候補矩形４」を個別に取得すると、８×８＋１４×８＋２×８＋８×８＝２５６画素分のデータ量となり、複数の候補文字領域（対象領域）の集まりとしてデータを取得した方が、記憶装置３００からの転送の効率は良くなり、パターンマッチング・類似度判定の高速化を図ることが出来る。さらに、ライン切り替え時のオーバーヘッドを考慮すると、複数の候補文字領域の集まりとしてデータを取得した方がラインの切り替え回数は少なくなる（上記の例では複数の候補文字領域の集まりとして取得した場合は８回、個別の矩形として取得した場合は３２回）ことから、転送の効率は良くなる。
（実施の形態２）

以下、本発明に係る画像処理装置を備えた画像読取装置について、通称フラットベッドスキャナを例として説明する。実施の形態２に係る画像読取装置は、実施の形態１の画像形成装置から一部を省略した構造である。

図２８は本発明の実施の形態２に係る画像読取装置の要部構成を示すブロック図である。実施の形態２に係る画像読取装置は、制御装置（図示せず）、画像入力装置２００、画像処理装置１００、記憶装置（図示せず）及び操作パネル５００等のハードウェアを備え、全体としてフラットベッドスキャナを構成している。

画像入力装置２００は、原稿の画像を光学的に読取る読取手段であり、読取用の原稿に光を照射する光源、例えばＣＣＤ（Charge Coupled Device）のようなイメージセンサ等を備えている。画像入力装置２００では、原稿からの反射光像を当該イメージセンサに結像させ、ＲＧＢ（R : Red, G : Green, B : Blue）のアナログ電気信号を出力する。画像入力装置２００が出力したアナログ電気信号は画像処理装置１００に入力される。

画像処理装置１００は、画像入力装置２００を通じて入力されるアナログ電気信号を基にデジタル形式の画像データを生成し、画像の種類に応じた処理を施した後、出力用の画像データ（送信画像）を生成する。

画像処理装置１００は、Ａ／Ｄ変換部２、シェーディング補正部３、入力階調補正部４、圧縮処理部１１、文字認識処理部１及びデータ変換部１２を備えている。

画像入力装置２００にて読み取られた画像データのアナログ信号は、画像処理装置１００内を、Ａ／Ｄ変換部２、シェーディング補正部３、入力階調補正部４、圧縮処理部１１、文字認識処理部１、データ変換部１２の順で送られるように構成されている。また、入力階調補正部４の後に分岐が行われており、入力階調補正部４からのデータは文字認識処理部１に出力されるように構成されている。

Ａ／Ｄ（アナログ／デジタル）変換部２は、ＲＧＢのアナログ信号をデジタル信号に変換するもので、シェーディング補正部３は、Ａ／Ｄ変換部２より送られてきたデジタルのＲＧＢ信号に対して、画像入力装置２００の照明系、結像系、撮像系で生じる各種の歪みを取り除く処理を施す。

また、入力階調補正部４によって前記変換処理が行われたデータは、圧縮処理部１１に入力され、圧縮処理部１１では入力されるＲＧＢ信号に対して圧縮処理を行う。圧縮の方式としては例えばJPEG（Joint Photographic Experts Group）を使用する。また、文字認識処理部１では文字認識処理を行い、文字コード及び座標を出力する。データ変換部１２では、これらのデータからPDF（Portable Document Format）のように送信出力に適したデータフォーマットに変換し、送信先に送信される。

文字認識処理部１は、実施の形態１の画像形成装置の文字認識処理部１と同様に、信号変換部、行切り出し部、領域画定部、照合処理部及び文字判定部を備えている。前記照合処理部は、領域切り抜き部、正規化処理部、入力特徴ベクトル格納部、パターンマッチング部（マッチング手段）、類似度格納部を夫々複数（例えば４ずつ）を備え、前記記憶装置からデータを取得する第１読出しＤＭＡ部を備えている。また、前記照合処理部は、実施の形態１の画像形成装置の文字認識処理部１と同様に、第２読出しＤＭＡ部、辞書バッファ及び辞書特徴ベクトル取得部をさらに備えている。

前記照合処理部は、複数の候補文字領域（対象領域）に対して並列してパターンマッチングを行う。つまり、前記照合処理部では、前記領域画定部によって画定された候補文字領域を、前記第１読出しＤＭＡ部が一括して複数取得し、一括して取得された複数の候補文字領域（対象領域）を候補文字領域毎に各領域切り抜き部へ切り抜き、各正規化処理部にて切り抜かれた対象領域に正規化を施した後、各候補文字領域に係る特徴ベクトルを検出して各入力特徴ベクトル格納部に格納する。各パターンマッチング部は、前記特徴ベクトルに基づき、パターンマッチング及び類似度の算出を行い、算出された類似度は各類似度格納部に格納される。尚、前記文字判定部は前記照合処理部によって算出された類似度に基づき、候補文字領域に係る文字の判定（文字認識）を行う。その他、詳細な内容は実施の形態１の記載と同様であり、詳しい説明を省略する。

また、前記辞書特徴ベクトル取得部は、前記辞書バッファに格納された辞書データを並列して複数のパターンマッチング部に供与し、各パターンマッチング部は同期して辞書データを取得することが出来る。

以上の記載においては、実施の形態２に係る画像読取装置として、フラットベッドスキャナを例として説明したが、これに限るものでなく、例えば、デジタルカメラに対しても適用することが可能である。

実施の形態１と同様の部分については、同一の符号を付して詳細な説明を省略する。

上記では、本発明に係る画像処理装置、画像読取装置及び画像形成装置がカラーの画像データに対応する場合を例として説明したが、これに限るものでなく、モノクロの画像データに対しても同様の効果が得られることは言うまでもない。

本発明の実施の形態１に係る画像形成装置の要部構成を示すブロック図である。本発明の実施の形態１に係る画像形成装置の画像処理装置の要部構成を示すブロック図である。本発明の実施の形態１に係る画像形成装置の文字認識処理部の要部構成を示すブロック図である。本発明の実施の形態１に係る画像形成装置の信号変換部の要部構成を示すブロック図である。混合フィルタの一例を示す例示図である。本発明の実施の形態１に係る画像形成装置の照合処理部の要部構成を示すブロック図である。特徴ベクトルの一例を示す例示図である。「あ」、「い」、「う」の文字コード夫々に対応した辞書特徴ベクトルの一例を示す例示図である。本発明の実施の形態１に係る画像形成装置の文字認識作用における、ＣＰＵの処理手順を示すフローチャートである。本発明の実施の形態１に係る画像形成装置の文字認識作用における、ＣＰＵの処理手順を示すフローチャートである。本発明の実施の形態１に係る画像形成装置の文字認識作用を説明するための原稿を示す説明図である。ステップ１０２の処理によって生成されたヒストグラムを説明する説明図である。ラスター走査方式の８連結によるラべリングを説明するための説明図である。ラべリングの一例を示す例示図である。図１２のΔＧ１に係る領域に対しるラべリング処理の結果を示す図である。ステップ１０４における座標特定の結果を示す図である。ステップ１０５における候補文字領域の画定の結果を示す図である。ステップ１０５における候補文字領域の画定の一例を説明するための例示図である。ステップ１０８及びステップ１０９を説明するための説明図である。ステップ１０８及びステップ１０９を説明するための説明図である。ステップ１０８及びステップ１０９を説明するための説明図である。正規化処理を説明するための説明図である。正規化処理を説明するための説明図である。正規化処理を説明するための説明図である。類似度の算出過程の一例を示す例示図である。全ての候補矩形に係る入力特徴ベクトルに対する類似度算出によって得られた結果を示す図表である。誤った類似度算出の一例を示す例示図である。本発明の実施の形態２に係る画像読取装置の要部構成を示すブロック図である。

符号の説明

１文字認識処理部
１００画像処理装置
２００画像入力装置（画像読取手段）
１０４照合処理部
１０４ａ第１読出しＤＭＡ部（一括取得手段）
１０４ｅパターンマッチング部（マッチング手段）
１０４ｉ辞書特徴ベクトル取得部（供与手段）
３００記憶装置
８００制御装置

Claims

入力画像から認識すべき文字を含む対象領域を取得し、該対象領域の特徴を示す特徴ベクトルと、予め記憶されている文字候補の特徴を示す辞書特徴ベクトルとのパターンマッチングを行い、文字を認識する画像処理装置において、
複数の対象領域を一括して取得する一括取得手段と、
一括して取得された各対象領域に対してパターンマッチングを並列して行う複数のマッチング手段と
を備えていることを特徴とする画像処理装置。
前記辞書特徴ベクトルを取得し、前記複数のマッチング手段に夫々供与する供与手段を備えることを特徴とする請求項１に記載の画像処理装置。
画像を読み取る画像読取手段と、
該画像読取手段によって読み取られた画像から前記対象領域を取得し、該対象領域の特徴ベクトルと、前記辞書特徴ベクトルとのパターンマッチングを行い、文字を認識する請求項１又は２に記載の画像処理装置と
を備えていることを特徴とする画像読取装置。
請求項１又は２に記載の画像処理装置を備え、
該画像処理装置による文字認識の結果に基づいて画像データを生成し、生成した画像データに応じて、シート上に画像を形成するように構成されていることを特徴とする画像形成装置。