JP2010128966A - 画像処理装置、画像読取装置及び画像形成装置 - Google Patents

画像処理装置、画像読取装置及び画像形成装置 Download PDF

Info

Publication number
JP2010128966A
JP2010128966A JP2008305162A JP2008305162A JP2010128966A JP 2010128966 A JP2010128966 A JP 2010128966A JP 2008305162 A JP2008305162 A JP 2008305162A JP 2008305162 A JP2008305162 A JP 2008305162A JP 2010128966 A JP2010128966 A JP 2010128966A
Authority
JP
Japan
Prior art keywords
image
unit
candidate
character
feature vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008305162A
Other languages
English (en)
Inventor
Akira Sakamoto
晃 阪本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2008305162A priority Critical patent/JP2010128966A/ja
Publication of JP2010128966A publication Critical patent/JP2010128966A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

【課題】認識すべき文字を含む対象領域を複数取得し、並列してパターンマッチングを行うことにより、パターンマッチングにおける所与時間を短縮させ、パターンマッチングの高速化を図ることが出来る画像処理装置、画像読取装置及び画像形成装置を提供する。
【解決手段】認識すべき文字を含む候補文字領域(対象領域)を複数一括して取得する第1読出しDMA部104a(一括取得手段)、及び前記候補文字領域に対してパターンマッチングを行うパターンマッチング部104e(マッチング手段)を複数備え、第1読出しDMA部104aによる一括取得に係る複数の候補文字領域に対して、複数のパターンマッチング部104eが夫々パターンマッチングを行う。
【選択図】図6

Description

本発明は、入力画像データに基づいてパターンマッチングを行い、文字を認識する画像処理装置、並びに該画像処理装置を備えた画像読取装置及び画像形成装置に関する。
従来、光学式文字読取装置(OCR : Optical Character Reader)のような文字認識装置では、一般的にパターンマッチング(又は照合)処理により文字認識を行う。パターンマッチング処理は、入力画像に基づき取得した、認識の対象となる文字を含む対象領域の特徴を示す入力特徴ベクトルと、あらかじめ辞書データとして登録された文字候補の特徴を示す辞書特徴ベクトルとのパターンマッチングを行い、その結果、前記入力特徴ベクトルと最も類似していると判断された辞書特徴ベクトルに対応する文字候補を、文字認識結果として決定するものである。このようなパターンマッチング処理は、一般的に負荷が大きく、多大な処理時間を要するので、様々な高速化手法が提案されている。
例えば、特許文献1では、各文字候補の特徴を示す辞書照合ベクトル(辞書特徴ベクトル)と、前記対象領域の特徴を示す入力照合ベクトル(特徴ベクトル)との内積を用いて一致度を判定することにより、演算量を減らし、パターンマッチング処理の高速化を図るパターン認識装置が開示されている。また、特許文献2では、1つの文字(対象領域)に対するパターンマッチングを行う処理ユニットを複数備えることで高速化を図るパターンマッチング回路が開示されている。
特開2008−97275号公報 特開昭61−51260号公報
しかしながら、特許文献1のパターン認識装置では、パターンマッチング処理を行うパターンマッチング部が1つのみである構成であり、パターンマッチング処理すべき文字(対象領域)の数が多い場合は、入力画像データからの前記対象領域の取得に多大な処理時間が所要されるという問題がある。
また、特許文献2のパターンマッチング回路では、複数の処理ユニット夫々が、辞書データを格納した辞書メモリを持つように構成されており、全体として多くのメモリが必要とされるという問題がある。
本発明は、斯かる事情に鑑みてされたものであり、その目的とするところは、複数の対象領域を一括して取得する一括取得手段と、一括して取得された各対象領域に対してパターンマッチングを並列して行う複数のマッチング手段とを備え、複数の対象領域に対して並列してパターンマッチングを行うことにより、パターンマッチングにおける所要時間を短縮させ、パターンマッチングの高速化を図ることが出来る画像処理装置、画像読取装置及び画像形成装置を提供することにある。
本発明に係る画像処理装置は、入力画像から認識すべき文字を含む対象領域を取得し、該対象領域の特徴を示す特徴ベクトルと、予め記憶されている文字候補の特徴を示す辞書特徴ベクトルとのパターンマッチングを行い、文字を認識する画像処理装置において、複数の対象領域を一括して取得する一括取得手段と、一括して取得された各対象領域に対してパターンマッチングを並列して行う複数のマッチング手段とを備えていることを特徴とする。
本発明にあっては、前記一括取得手段によって、一括して取得された複数の対象領域は、前記複数のマッチング手段に夫々割り当てられ、各マッチング手段は、割り当てられた対象領域に係る特徴ベクトルと、前記辞書特徴ベクトルとに基づき、並列してパターンマッチングを行う。
本発明に係る画像処理装置は、前記辞書特徴ベクトルを取得し、前記複数のマッチング手段に夫々供与する供与手段を備えることを特徴とする。
本発明にあっては、前記供与手段が前記辞書特徴ベクトルを取得して前記複数のマッチング手段に夫々与え、前記辞書特徴ベクトルに基づき、前記複数のマッチング手段が複数の対象領域に対して並列してパターンマッチングを行う。
本発明に係る画像読取装置は、画像を読み取る画像読取手段と、該画像読取手段によって読み取られた画像から前記対象領域を取得し、該対象領域の特徴ベクトルと、前記辞書特徴ベクトルとのパターンマッチングを行い、文字を認識する前述の本発明のいずれか一つの画像処理装置とを備えていることを特徴とする。
本発明にあっては、前記画像処理装置は、前記画像読取手段によって読み取られた画像から認識すべき文字を含む対象領域を取得し、該対象領域の特徴を示す特徴ベクトルと、予め記憶されている文字候補の特徴を示す辞書特徴ベクトルとのパターンマッチングを行い、文字を認識する。
本発明に係る画像形成装置は、前述の本発明のいずれか一つの画像処理装置を備え、該画像処理装置による文字認識の結果に基づいて画像データを生成し、生成した画像データに応じて、シート上に画像を形成するように構成されていることを特徴とする。
本発明にあっては、入力画像に対して前記画像処理装置が文字認識を行い、前記画像処理装置による文字認識の結果に基づいて画像データが生成され、該画像データに応じて、シート上に画像が形成される。
本発明によれば、複数の対象領域を一括取得し、夫々の対象領域に対して夫々のマッチング手段が並列してパターンマッチングを行うので、パターンマッチングにおける処理時間を短縮させ、パターンマッチングの高速化を図ることが出来る。
以下、本発明に係る画像処理装置を備える画像形成装置を、コピー機能、印刷機能等を有するデジタル複合機に適用した形態について図面を用いて具体的に説明する。
(実施の形態1)
図1は本発明の実施の形態1に係る画像形成装置の要部構成を示すブロック図である。実施の形態1に係る画像形成装置は、制御装置800、画像入力装置200、画像処理装置100、画像出力装置700、記憶装置300、記憶制御装置400、通信装置600及び操作パネル500等のハードウェアを備え、全体としてデジタル複合機を構成している。
制御装置800は、これらのハードウェアを制御するCPUと、制御の際に必要なデータ等を一時的に保持するRAMとを備えている。記憶装置300は、例えば、不揮発性の半導体メモリであり、画像処理用の画像データ、ハードウェア各部を制御するための制御プログラム、パターンマッチング(照合)処理に用いられる文字候補の辞書特徴ベクトル、文字コード等の辞書データ、後述の候補文字領域(対象領域)の画定に係る入力特徴ベクトル(特徴ベクトル)及び前記辞書特徴ベクトルに基づき、類似度、文字判定等を行うための判定プログラム等を予め記憶している。
制御装置800は必要に応じて記憶装置300から制御プログラム、判定プログラム等をロードし、ロードした制御プログラム、判定プログラム等を実行することにより、装置全体を本発明に係る画像処理装置を備えた画像形成装置として動作させる。
また、操作パネル500は、デジタル複写機の動作モードを設定するための設定ボタン、テンキー、及び液晶ディスプレイ等の表示部を備えている。
なお、記憶制御装置400は、記憶装置300へのデータの書き込み、読み出しの制御を行う。また、後述する文字認識処理部1の照合処理部104の第1読み出しDMA104a及び制御装置800のCPUへのデータ送出、又は第1読み出しDMA104a及び制御装置800のCPUから出力されたデータ、命令の受信制御を行う。
画像入力装置200は、原稿の画像を光学的に読取る読取手段であり、読取用の原稿に光を照射する光源、例えばCCD(Charge Coupled Device)のようなイメージセンサ等を備えている。画像入力装置200では、所定の読取り位置にセットされた原稿からの反射光像を当該イメージセンサに結像させ、RGB(R : Red, G : Green, B : Blue)のアナログ電気信号を出力する。画像入力装置200が出力したアナログ電気信号は画像処理装置100に入力される。
通信装置600は、画像処理装置100にて処理した後の画像データを外部へ送信するネットワークカード、モデムなどの通信装置600であり、例えば、前記画像データをメールに添付して設定された送信先に送信する。
画像出力装置700は、画像処理装置100から出力される画像データに基づいて用紙、OHPフィルム等のシート上に画像形成を行う。そのため、画像出力装置700は、感光体ドラム、該感光体ドラムを所定の電位に帯電させる帯電器、外部から受付けた画像データに応じてレーザ光を発して感光体ドラム上に静電潜像を生成させるレーザ書込装置、感光体ドラム表面に形成された静電潜像にトナーを供給して顕像化する現像器、感光体ドラム表面に形成されたトナー像を用紙上に転写する転写器等(図示せず)を備えており、電子写真方式にて利用者が所望する画像をシート上に形成する。なお、レーザ書込装置を用いた電子写真方式により画像形成を行う他、インクジェット方式、熱転写方式、昇華方式等により画像形成を行う構成であってもよい。
画像処理装置100は、画像入力装置200を通じて入力されるアナログ電気信号を基にデジタル形式の画像データを生成し、画像の種類に応じた処理を施した後、出力用の画像データを生成する。生成した画像データは画像出力装置700又は通信装置600に出力される。
図2は本発明の実施の形態1に係る画像形成装置の画像処理装置100の要部構成を示すブロック図である。
画像処理装置100は、A/D変換部2、シェーディング補正部3、入力階調補正部4、領域分離処理部5、色補正部6、黒生成下色除去部7、空間フィルタ処理部8、出力階調補正部9、階調再現処理部10、圧縮処理部11、文字認識処理部1及びデータ変換部12を備えている。
画像入力装置200にて読み取られた画像データのアナログ信号は、画像処理装置100内を、A/D変換部2、シェーディング補正部3、入力階調補正部4、領域分離処理部5、色補正部6、黒生成下色除去部7、空間フィルタ処理部8、出力階調補正部9、階調再現処理部10の順で送られ、ストリームとして画像出力装置700へ出力されるように構成されている。また、入力階調補正部4の後に分岐が行われており、入力階調補正部4からのデータは圧縮処理部11及び文字認識処理部1を介して、データ変換部12に送られ、通信装置600に出力されるように構成されている。
A/D(アナログ/デジタル)変換部2は、RGBのアナログ信号をデジタル信号に変換するもので、シェーディング補正部3は、A/D変換部2より送られてきたデジタルのRGB信号に対して、画像入力装置200の照明系、結像系、撮像系で生じる各種の歪みを取り除く処理を施すものである。
入力階調補正部4は、シェーディング補正部3から入力されたRGB信号(RGBの反射率信号)に対して、カラーバランスを整えると同時に、濃度信号等の画像処理装置100に採用されている画像処理システムの扱い易い信号に変換する変換処理を施すものである。
領域分離処理部5は、RGB信号より、入力画像中の各画素を文字領域、網点領域、写真領域の何れかに分離するものである。領域分離処理部5は、分離結果に基づき、画素がどの領域に属しているかを示す領域識別信号を、黒生成下色除去部7、空間フィルタ処理部8、及び階調再現処理部10へ出力すると共に、入力階調補正部4から出力された入力信号をそのまま色補正部6に出力する。
色補正部6は、色再現の忠実化実現のために、不要吸収成分を含むCMY(C:シアン・M:マゼンタ・Y:イエロー)色材の分光特性に基づいた色濁りを取り除く処理を行うものである。
黒生成下色除去部7は、色補正後のCMYの3色信号から黒(K)信号を生成する黒生成、元のCMY信号から前記黒生成で得たK信号を差し引いて新たなCMY信号を生成する処理を行うものであって、CMYの3色信号はCMYKの4色信号に変換される。
黒生成処理の一例として、スケルトンブラックによる黒生成を行なう方法がある。この方法では、スケルトンカーブの入出力特性をy=f(x)、入力されるデータをC、M、Y、出力されるデータをC'、M'、Y'、K'、UCR(Under Color Removal)率をα(0<α<1)とすると、黒生成下色除去処理は以下の式(1)で表わされる。
Figure 2010128966
空間フィルタ処理部8は、黒生成下色除去部7より入力されるCMYK信号の画像データに対して、領域識別信号を基にデジタルフィルタによる空間フィルタ処理を行い、空間周波数特性を補正することによって出力画像のぼやけ及び粒状性劣化を防ぐように処理するものであって、階調再現処理部10も、空間フィルタ処理部8と同様に、CMYK信号の画像データに対して、領域識別信号を基に所定の処理を施すものである。
例えば、領域分離処理部5にて文字に分離された領域は、特に黒文字或いは色文字の再現性を高めるために、空間フィルタ処理部8による空間フィルタ処理における鮮鋭強調処理で高周波数の強調量が大きくされる。同時に、階調再現処理部10においては、高域周波数の再現に適した高解像度のスクリーンでの二値化または多値化処理が選択される。
また、領域分離処理部5にて網点に分離された領域に関しては、空間フィルタ処理部8において、入力網点成分を除去するためのローパス・フィルタ処理が施される。そして、出力階調補正部9では、濃度信号等の信号を画像出力装置700の特性値である網点面積率に変換する出力階調補正処理を行った後、階調再現処理部10で、最終的に画像を画素に分離して夫々の階調を再現できるように処理する階調再現処理(中間調生成)が施される。領域分離処理部5にて写真に分離された領域に関しては、階調再現性を重視したスクリーンでの二値化または多値化処理が行われる。
また、入力階調補正部4によって前記変換処理が行われたデータは、圧縮処理部11に入力され、圧縮処理部11では入力されるRGB信号に対して圧縮処理を行う。圧縮の方式としては例えばJPEG(Joint Photographic Experts Group)を使用する。また、文字認識処理部1では後述する候補文字領域に対する文字認識処理を行い、文字コード及び座標を出力する。データ変換部12では、これらのデータからPDF(Portable Document Format)のように送信出力に適したデータフォーマットに変換し、例えば、操作パネル500において、通称‘scan to e-mailモード’が選択されている場合、ネットワークカード又はモデム等の通信装置600により、メールに添付されて設定された送信先に送信される。
上述したように各処理が施された画像データは、一旦記憶手段(例えば、記憶装置300)に記憶され、所定のタイミングで読み出されて画像出力装置700に入力される。画像出力装置700は、例えば、電子写真方式又はインクジェット方式を用いた画像出力装置を挙げることができるが、これに限定されるものではない。尚、以上の処理は制御装置800のCPUにより制御される。また、ファクシミリの送信を行うときは、モデムにて、相手先との送信手続きを行って送信可能な状態が確保されると、所定の形式で圧縮された画像データ(スキャナで読み込まれた画像データ)をメモリから読み出し、圧縮形式の変更等必要な処理を施して、相手先に通信回線を介して順次送信する。
一方、ファクシミリを受信する場合、制御装置800のCPUは、通信手続きを行いながら相手先から送信されてくる画像データを受信して画像処理装置100に入力し、画像処理装置100では、受信した画像データを、圧縮/伸張処理部(図示せず)にて伸張処理を施す。伸張された画像データは、必要に応じて、回転処理、解像度変換処理等の処理が行なわれ、出力階調補正、階調再現処理が施された後、画像出力装置より出力される。また、ネットワークカード、LANケーブルを介して、ネットワークに接続されたコンピュータ及び他のデジタル複合機とデータ通信を行なう。
図3は本発明の実施の形態1に係る画像形成装置の文字認識処理部1の要部構成を示すブロック図である。文字認識処理部1は信号変換部101、行切り出し部102、領域画定部103、照合処理部104及び文字判定部105を備えている。
図4は信号変換部101の要部構成を示すブロック図である。信号変換部101は無彩化処理部101a、MTF補正処理部101b及び2値化処理部101cを備えており、入力RGB画像データを2値データへと変換する。
無彩化処理部101aは、入力画像データがカラー画像であった場合に無彩化して、明度もしくは輝度信号に変換するための処理部である。例えば、Yj =0.30Rj +0.59Gj +0.11Bj (Yj :各画素の輝度値,Rj 、Gj 、Bj :各画素の色成分)の式により輝度Yを求める。尚、このような方法ではなく、RGB信号をCIE1976L***信号(CIE : Commission International de l'Eclairage、L*:明度、a*, b*:色度)に変換しても良い。
MTF補正処理部101bは、画像入力装置の空間周波数特性が機種ごとに異なることを吸収するために用いられる。CCDの出力する画像信号には、レンズ及びミラー等の光学部品、CCDの受光面のアパーチャ開口度、転送効率及び残像、物理的な走査による積分効果及び走査むら等に起因しMTFの劣化が生じている。このMTFの劣化により、読み込まれた画像がぼやけることになる。MTF補正処理部101bは、適切なフィルタ処理(強調処理)を施すことにより、MTFの劣化により生じるぼやけを修復する処理を行う。また、後段処理に不要な高周波成分を抑制するためにも用いる。すなわち、図5に示すような混合フィルタを用いて強調及び平滑化処理を行う。
2値化処理部101cは、無彩化された画像データ(輝度値(輝度信号)又は明度値(明度信号))を所定閾値と比較することにより画像を2値化する。例えば、輝度値又は明度値が50以下であれば黒画素(値は「1」)、50より大きければ白画素(値は「0」)として判定する。
文字認識処理部1の行切り出し部102、信号変換部101により2値化された画像に対して、副走査座標単位で加算していき、ヒストグラムを生成する。そして、所定の閾値以上に連続するヒストグラム結果に係る領域を一つの行として切り出す。
領域画定部103は、行切り出し部102で切り出された行に対して、ラベリング処理を行い、候補文字領域(対象領域)を画定する。ラベリング処理とは、つながっているすべての画素(以下、連結成分と言う。)に同じラベル(番号)を付し、異なった連結成分には異なった番号を付する処理のことをいう。例えば、「い」の文字の場合、2つの連結成分を有し、夫々の連結成分は異なる番号が付される。
照合処理部104は複数の候補文字領域(対象領域)に対して並列して照合(パターンマッチング)を行う。詳しくは、照合処理部104は、領域画定部103により画定された候補文字領域を、一括して複数取得し、一括して取得された複数の候補文字領域を候補文字領域毎に切り抜き、切り抜かれた対象領域に正規化を施した後、特徴ベクトルを検出して該特徴ベクトルに基づいてパターンマッチングを行い、後述する類似度の算出を行う。尚、文字判定部105は照合処理部104によって算出された類似度に基づき、候補文字領域に係る文字の判定(文字認識)を行う。
図6は本発明の実施の形態1に係る画像形成装置の照合処理部104の要部構成を示すブロック図である。照合処理部104は第1読出しDMA部104a、領域切り抜き部104b、正規化処理部104c、入力特徴ベクトル格納部104d、パターンマッチング部104e(マッチング手段)及び類似度格納部104fを備えており、これらの各部(第1読出しDMA部104aを除く。)は夫々複数設けられている。以下の説明においては、便宜上、前記各部を夫々4つずつ備えている場合を例として説明する。なお、照合処理部104は第2読出しDMA部104g、辞書バッファ104h及び辞書特徴ベクトル取得部104i(供与手段)をさらに備えている。
第1読出しDMA部104a及び第2読出しDMA部104gは記憶装置300から読み出すデータの開始アドレス、データ容量を指定して、記憶装置300にデータ読み出しを要求することにより、記憶装置300からデータを取得する。
第1読出しDMA部104aは、複数の候補文字領域(対象領域)に対して並列してパターンマッチングによる類似度判定を行うため、複数の候補文字領域を一括して取得するように、データの開始アドレス、データ容量を指定する。換言すれば、第1読出しDMA部104aは複数のパターンマッチング部104eで処理できるだけの数の候補文字領域を一括して取得する。従って、第1読出しDMA部104aにより一括して取得される候補文字領域の数は、前記各部が、特にパターンマッチング部104eが、夫々幾つずつ設けられているかによって決められる。例えば、上述したように、前記各部を夫々4つずつ備えている場合は、第1読出しDMA部104aは4つの候補文字領域を一括して取得する。尚、第2読出しDMA部104gは、辞書バッファ104hに空きがあれば、パターンマッチングに用いられる文字候補に係る辞書データを取得するように、前記辞書データの開始アドレス、データ容量を指定する。
第1読出しDMA部104aにより一括して取得された複数の候補文字領域は候補文字領域毎に切り抜かれ、夫々の領域切り抜き部104bへ割り当てられる。
正規化処理部104cは、後述する辞書特徴ベクトルが8×8(画素)の2値画像で構成されているため、入力画像をこれと同じ容量に変換(正規化)して入力特徴ベクトルを得る。各正規化処理部104cの正規化によって得られた入力特徴ベクトルは、対応する入力特徴ベクトル格納部104dに夫々格納される。
辞書特徴ベクトル取得部104i(供与手段)は辞書バッファ104hの空き状況を管理する。辞書バッファ104hに空きがあれば、次に用いるべき文字候補に係る辞書データを第2読出しDMA部104gに要求する。これにより、記憶装置300に格納されている辞書データ(辞書特徴ベクトル群)を辞書バッファ104hに格納できる。なお、辞書特徴ベクトル取得部104iは、辞書バッファ104hに格納された辞書データを並列して複数のパターンマッチング部104eに供与し、複数のパターンマッチング部104eは同期して辞書データを取得することが出来る。
図7は特徴ベクトルの一例を示す例示図である。前記特徴ベクトルとは、8×8の画素の夫々を「0」又は「1」で示した矩形の64個の成分(画素)からなるベクトルである。記憶装置300には、夫々の文字コードと、前記ベクトルとを対応付けた辞書データが格納されている。
図8は「あ」、「い」、「う」の文字コード夫々に対応した辞書特徴ベクトルの一例を示す例示図である。8×8の画素の夫々において、文字部分及び余白部分が夫々「1」又は「0」で表示されている。また、フォントの違いも加味して、夫々の文字コードに対応して複数の特徴ベクトルを対応付けてもよい。以下の説明においては、説明の便宜上、前記辞書データは「あ」、「い」、「う」の文字の辞書特徴ベクトルのみを有するものとする。実際上は、多数の文字、多数のフォントがあるため、一般的に辞書の容量は大きくなり、辞書バッファ104hに全ての辞書データを格納できなくなる。そのため、本発明の実施の形態1に係る画像形成装置は、すべての辞書データは記憶装置300に格納し、パターンマッチングに必要なタイミングで必要な容量の辞書データを随時取得し、パターンマッチングを行うように構成されている。
パターンマッチング部104eでは、入力特徴ベクトル格納部104dに格納された入力特徴ベクトル、及び辞書特徴ベクトル取得部104iによって取得された辞書特徴ベクトルに基づき、パターンマッチング及び類似度(match)の算出を行う。以下、前記パターンマッチング及び類似度の算出について詳しく説明する。
まず、前記入力特徴ベクトルの画素をxi (i=0〜63)、前記辞書特徴ベクトルの画素をyi (i=0〜63)とし、以下の式(2)、式(3)及び式(4)によって、一つの候補文字領域の入力特徴ベクトルの総数(sum_in)と、一つの文字候補の辞書特徴ベクトルの総数(sum_dic)と、入力特徴ベクトル及び辞書特徴ベクトルの内積(inner_product)とを、夫々算出する。
Figure 2010128966
Figure 2010128966
Figure 2010128966
これらの式によって得られた結果において、入力特徴ベクトルに対する一致割合(ratio_sum_in)、及び辞書特徴ベクトルに対する一致割合(ratio_sum_dic)は夫々以下のように算出することが出来る。
Figure 2010128966
Figure 2010128966
このようにして得られた入力特徴ベクトルに対する一致割合及び辞書特徴ベクトルに対する一致割合を、以下の式(7)によって掛け合わせた結果を類似度(match)とする。以上のような手順によって、各パターンマッチング部104eにて得られた類似度は、夫々の類似度格納部104fに格納される。
Figure 2010128966
以下、本発明の実施の形態1に係る画像形成装置の文字認識作用について説明する。図9及び図10は本発明の実施の形態1に係る画像形成装置の文字認識作用における、CPUの処理手順を示すフローチャートである。説明の便宜上、以下においては、図11に示すように、「あ」、「い」、「う」の3つの文字が夫々2行に書かれた原稿が、画像入力装置200によって読み取られた場合の画像データを例として説明する。
画像入力装置200にて読み取られた画像データ(RGB画像)のアナログ信号は、画像処理装置100のA/D変換部2、シェーディング補正部3及び入力階調補正部4を介して文字認識処理部1に入力される。
文字認識処理部1に前記画像データが入力された場合、CPUは入力された前記画像データを2値データへと変換するように信号変換部101に指示する(ステップ101)。
CPUは、信号変換部101により2値化された画像データに基づき、文字認識の対象となる文字が含まれた領域を一つの行として切り出すように行切り出し部102に指示する(ステップ102)。詳しくは、図12に示すように、行切り出し部102が、2値化された画像データを副走査座標単位で加算していき、ヒストグラムを生成する。そして、所定の閾値(例えば4)以上副走査方向に「1」の値が連続するヒストグラム結果に係る領域(図12中ΔG1、ΔG2)を一つの行として切り出す。図12の例においては、副走査座標2〜9、15〜22がその条件を満たしており、行として切り出される。また、文字の上端及び下端部分ではヒストグラム結果が小さくなる可能性があるので、行切り出し範囲を少し広めにしても良い。つまり、図12の例の場合、副走査座標1〜10、14〜22を行として切り出しても良い。以下、説明の便宜上、副走査座標2〜9までの領域(ΔG1)を切り出した場合を例として説明する。
次いで、CPUは、行切り出し部102により切り出された領域(行)の画素に対するラベリング処理を領域画定部103に指示する(ステップ103)。以下、ラスター走査方式の8連結による連結関係に基づいて、前記領域の左上から右下(図面視)方向へラベリング処理が行われる場合を例として、ラべリング処理の方法を詳しく説明する。ラスター走査方式の8連結とは、図13に示すような、注目画素(fij)と4つの隣接画素との関係に基づき、ラベル(番号)付する方式である。以下の説明においては、ラスター走査方式の8連結による連結関係に基づく場合を例として説明するが、これに限るものでなく、ラスター走査方式の4連結による連続関係の場合であっても良い。
領域画定部103は、(1)‐注目画素(fij)が黒画素(値が「1」)でなければ「0」をラべリングする。(2)‐注目画素が黒画素(値が「1」)であれば、図13に示す隣接画素との連結関係を満たしているか判定する。(3)‐(2)で図13の連結関係を満たしており、連結関係内(隣接画素)のラベルが1種類であれば、そのラベルを割り付ける。(4)‐(2)で図13の連結関係を満たしており、連結関係内のラベルが複数の種類であれば、その中で最も若い番号のラベルを割り付け、連結関係内の他のラベルもその中で最も若い番号のラベルに変更する(例えば、図14のような場合は、注目画素のラベルは3になると共に、ラベル9についても3に変更する)。(5)‐(2)で図13の連結関係を満たしていなければ新規ラベルを割り付ける(ラベルの値は0以外)。このようにして、図12のΔG1に係る領域に対してラべリング処理を行った結果を図15に示す。各文字の連結成分毎に1から5までの番号によってラべリングされている。例えば、一つの連結成分を有する「あ」の文字は一つの番号が付され、2つの連結成分を有する「い」の文字は、夫々「2」及び「4」の番号が付されている。
次いで、CPUは領域画定部103に座標特定を指示する(ステップ104)。領域画定部103は、図12のΔG1に係る領域に対するラべリング処理の結果に基づき、各連結成分を囲む最少の矩形領域に係る主走査座標及び副主走査座標を特定する。座標特定の結果を図16に示す。「1」から「5」までの各連結成分を囲む最少の矩形領域が、最小座標(MIN_X、MIN_Y)及び最大座標(MAX_X、MAX_Y)として特定されている。
また、CPUは領域画定部103に候補文字領域の画定を指示する(ステップ105)。CPUの指示に応じて、領域画定部103は照合(文字認識)の対象となるべき文字が含まれた候補文字領域(対象領域)を画定する。
詳しい画定方法について説明する。(1)図16のMIN_Xが小さい方から順に注目する矩形領域とし、これを候補文字領域(対象領域)とする。(2)注目する矩形領域のMIN_X , MAX_X に対して、他の矩形領域内のいずれかの主走査座標xが、「MIN_X<x<MAX_X+Dist」を満たしていれば、斯かる矩形領域の組み合わせを候補文字領域とする。ここで、Distは、他の矩形領域との組み合わせを候補文字領域として画定する際の探索距離を示しており、例えば、行切り出し時の副走査座標の範囲(8:副走査座標2〜9)を用いる。このような候補文字領域の画定の結果を図17に示す。候補番号「1」から「10」までの候補文字領域が画定されている。一方、番号「4」と「3」のみの場合も上記の画定方法の結果として得られるが、図18に示すような候補文字領域となり、番号「5」の連結成分の一部も含んでいるため、この組み合わせは画定結果から排除される。なお、この画定結果は、記憶装置300に記憶される。
照合処理部104では、このようにして得られた各候補文字領域と、記憶装置300に予め記憶されている辞書データ(文字候補の辞書特徴ベクトル)とのパターンマッチングを行う。
次いで、CPUは「X」を「0」とし(ステップ106)、「Y」を「X+4」とし(ステップ107)、候補番号「X+1」から「Y」までの複数の候補文字領域の一括取得を、照合処理部104の第1読出しDMA部104aに指示する(ステップ108)。記憶装置300に記憶された前記画定結果に基づき、第1読出しDMA部104aは、4つ(「1」〜「4」)の候補文字領域を一括取得する。また、このように一括取得された4つの候補文字領域は切り抜かれ、4つの切り抜き部104b,104b,104b,104bに夫々割り当てられる(ステップ109)。
このような、ステップ108及びステップ109の処理を詳しく説明する。図19、図20及び図21はステップ108及びステップ109を説明するための説明図である。
上述したように、第1読出しDMA部104aにより一括して取得される候補文字領域の数は、切り抜き部104b、正規化処理部104c等が夫々幾つずつ設けられているかによって決められるので、本発明の実施の形態1に係る画像形成装置において、4つずつ設けられており、第1読出しDMA部104aは、前記画定の結果に基づき、4つの候補文字領域を含む領域を一括取得する。また、候補文字領域は候補番号「1」から「10」まで10個であるので、候補番号「1」〜「4」、「5」〜「8」、「9」〜「10」の3回に分けて、前記2値化された画像データから一括取得を行う。実質上は、一回目の一括取得の後、パターンマッチングが行われてから、次回の一括取得が行われるが、説明の便宜上、以下においては、一括取得の処理についてのみ説明する。
1回目の候補文字領域の一括取得では、候補番号「1」〜「4」の候補文字領域が含まれる、(MIN_X,MINY)=(3,2)及び(MAX_X,MAXY)=(22,9)の座標によって特定される矩形領域を取得する。その後、一括取得された前記矩形領域から、候補番号「1」〜「4」の候補文字領域に係る「候補矩形1」〜「候補矩形4」が夫々4つの切り抜き部104b,104b,104b,104bに夫々割り当てられる(図19参照)。
2回目の候補文字領域の一括取得では、候補番号「5」〜「8」の候補文字領域が含まれる、(MIN_X,MINY)=(21,2)及び(MAX_X,MAXY)=(34,9)の座標によって特定される矩形領域が取得され、候補番号「5」〜「8」の候補文字領域に係る「候補矩形5」〜「候補矩形8」が夫々4つの切り抜き部104b,104b,104b,104bに夫々割り当てられる(図20参照)。
3回目の候補文字領域の一括取得では、候補番号「9」〜「10」の候補文字領域が含まれる、(MIN_X,MINY)=(27,2)及び(MAX_X,MAXY)=(34,9)の座標によって特定される矩形領域が取得され、候補番号「9」〜「10」の候補文字領域に係る「候補矩形9」〜「候補矩形10」が夫々2つの切り抜き部104b,104bに夫々割り当てられる(図21参照)。以上の処理によって「候補矩形1」から「候補矩形10」までが得られる。
次いで、前記辞書ベクトルと同じ容量に変換し、対象となる候補矩形の入力特徴ベクトルを得るために、正規化処理が行われる。ここまでは、候補番号「1」〜「4」の候補文字領域に係る「候補矩形1」〜「候補矩形4」が得られており、CPUは、前記「候補矩形1」〜「候補矩形4」に対する正規化を、正規化処理部104cに指示する(ステップ110)。前記正規化処理とは、候補矩形の主走査サイズ、副走査サイズをそれぞれ8で割った値を座標が増加する毎に加算していき、その整数部分の座標の値を正規化後の入力特徴ベクトルとするものである。
以下、正規化について、「候補矩形1」〜「候補矩形3」を例として詳しく説明する。図22、図23及び図24は、正規化処理を説明するための説明図である。
候補矩形1の正規化では、候補矩形1(画素)が8×8であるため、正規化後の入力特徴ベクトルも同じものとなる(図22参照)。候補矩形2の正規化では、主走査サイズが14であることから、14/8=1.75ずつ対応する候補矩形2の座標を加算する(整数部分のみを使用する)。その結果、正規化後の主走査座標は、0、1、3、5、7、8、10、12が夫々対応することとなる(図23参照)。また、候補矩形3の正規化では、主走査サイズが2であることから、2/8=0.25ずつ対応する候補矩形3の座標を加算する。その結果、正規化後の主走査座標は、0、0、0、0、1、1、1、1が夫々対応することとなる(図24参照)。なお、正規化処理部104cの正規化によって得られた各入力特徴ベクトルは夫々対応する入力特徴ベクトル格納部104dに格納される。
以降、得られた各候補矩形の入力特徴ベクトルと、前記辞書特徴ベクトルとに基づくパターンマッチング及び前記類似度算出が行われるが、これに先立って文字候補の辞書特徴ベクトルの取得を行う。
CPUは、辞書特徴ベクトル取得部104iに指示し、辞書特徴ベクトルを取得して各パターンマッチング部104eに供与する(ステップ111)。辞書特徴ベクトル取得部104iは、記憶装置300からの辞書特徴ベクトルの取得を第2読出しDMA部104gに求め、辞書バッファ104hに辞書特徴ベクトルが格納される。また、辞書特徴ベクトル取得部104iは、前記辞書特徴ベクトルを各パターンマッチング部104eに並列して供与する。従って、各パターンマッチング部104eが同じ辞書特徴ベクトルを同期して取得することができ、全体としては、辞書データ(辞書特徴ベクトル)へのアクセスを1/Nに減少させることが出来る。
次いで、CPUはパターンマッチングに基づく類似度の算出を、各パターンマッチング部104eに指示する(ステップ112)。CPUの指示に応じて、各パターンマッチング部104eは、対応する入力特徴ベクトル格納部104dに格納されている入力特徴ベクトル及び取得した前記辞書特徴ベクトルに基づき、パターンマッチング及び類似度算出の処理を行う。該処理は、上述したように、式(2)から式(4)までを用い、「sum_in」、「sum_dic」及び「inner_product」を算出し、更に、これらを式(5)及び式(6)に代入して「ratio_sum_in」及び「ratio_sum_dic」を算出し、「ratio_sum_in」及び「ratio_sum_dic」を式(7)に代入して類似度(match)を算出する処理である。
図25は類似度の算出過程の一例を示す例示図である。図25には、「候補矩形1」に係る入力特徴ベクトルにおける類似度算出過程を示している。これは、「あ」、「い」、「う」の文字候補の辞書特徴ベクトルを取得し、「候補矩形1」に係る入力特徴ベクトルとのパターンマッチングを行った結果である。例えば、「候補矩形1」に係る入力特徴ベクトルの「sum_in」、「sum_dic」及び「inner_product」は夫々29、28及び27であり、「ratio_sum_in」、「ratio_sum_dic」及び類似度は夫々0.9310、0.9643及び0.8978であることが見て取れる。図26は全ての候補矩形に係る入力特徴ベクトルに対する類似度算出によって得られた結果を示す図表である。なお、図26では、各候補矩形と、該候補矩形に含まれる連結成分(ラベル)との関係を合わせて示している。なお、夫々のパターンマッチング部104eでの類似度算出によって得られた結果は、対応する類似度格納部104fに夫々格納される。
ここで、類似度(match)を入力特徴ベクトルに対する一致割合(ratio_sum_in)、及び辞書特徴ベクトルに対する一致割合(ratio_sum_dic)を掛けたもので定義した理由は、何れか一方で類似度を定義した場合、誤って類似度を高くしてしまう虞があるからである。図27は誤った類似度(match)算出の一例を示す例示図である。
例えば、「候補矩形10」の場合、正規化後には入力特徴ベクトルはすべて「1」となるが、このとき、「ratio_sum_dic」は常に1.0000となり、どの辞書特徴ベクトルとも類似度が高くなってしまう。また、図27に示すような入力特徴ベクトルであると、例えば、文字候補「あ」の辞書特徴ベクトルでは前記入力特徴ベクトルに対する「ratio_sum_in」が高くなり、誤った類似度が算出される。このような誤った類似度の算出は入力特徴ベクトルの「1」の数が少ない場合に発生しやすくなる。以上のことから、類似度(match)を「ratio_sum_in」と「ratio_sum_dic」とを掛けたもので定義している。
次いで、CPUは、前記「Y」が「10」であるか否かを判定する(ステップ113)。CPUが前記「Y」が「10」であると判定した場合(ステップ113:YES)、処理はステップ114に進む。一方、CPUが前記「Y」が「10」でないと判定した場合(ステップ113:NO)、処理はステップ115に進む。
ここまでの処理では、前記「Y」は「4」であるので、CPUは前記「Y」が「10」でないと判定し、処理はステップ115に進む。ステップ115にて、CPUは「Y」(「4」)を「X」に代入し、「X+4」が「10」未満であるか否かを判定する(ステップ116)。
CPUは、「X+4」が「10」未満であると判定した場合(ステップ116:YES)、処理はステップ107に戻る。一方、「X+4」が「10」未満でないと判定した場合(ステップ116:NO)、処理はステップ117を介してステップ108に戻る。
ここまでの処理では、「X+4」は「8」であり、「10」未満である。従って、処理はステップ107に戻り、ステップ107からステップ112までの処理が再び行われる。つまり、「5」〜「8」の候補文字領域に対する一括取得、領域切り抜き及び正規化処理等が行われる。これらのステップに対しては、上述したものと同様であり、詳しい説明を省略する。以降、CPUは、「Y」が「10」であるか否かを判定する(ステップ113)。今回「Y」は「8」であり、ステップ115を介してステップ116に進む。
上記したように、「Y」は「8」であるので、CPUは「X+4」が「10」未満でないと判定し(ステップ116:NO)、ステップ117に進む。次いで、CPUは「Y」に「10」を代入し(ステップ117)、「9」〜「10」の候補文字領域の一括取得を照合処理部104の第1読出しDMA部104aに指示する(ステップ108)。
以降、ステップ109からステップ112までの処理が再び行われる。これらのステップに対しては、上述したものと同様であり、詳しい説明を省略する。
次いで、CPUは「Y」が「10」であるか否かを判定する(ステップ113)。今回「Y」は「10」であり、CPUは「Y」が「10」であると判定する(ステップ113:YES)。CPUは、各類似度格納部104fに格納されている類似度に基づく文字の判定(認識)を、文字判定部105に指示する(ステップ114)。CPUの指示に応じて文字判定部105は、候補番号「1」から「10」までの候補文字領域に対する文字の判定を行う。
以下、前記文字の判定手順について詳しく説明する。図16に示すラベリング結果のMIN_Xの小さい順に、換言すれば、図15において図面視左側から、各候補文字領域に対する文字の判定を行う。従って、1、2、4、5、3のラベル(番号)順に、各ラベルを含む候補文字領域に対する文字の判定が行われる。
文字判定部105は、まずラベル1に対して文字判定を行う。ラベル1を含む候補文字領域は候補1及び候補2であるため、この中から最も高い類似度のものを選択する。候補1及び候補2の中では、候補1と、文字候補「あ」との類似度が最も高いので、候補1は「あ」であると判定する。そして、文字候補「あ」の文字コードと共に、候補1の候補文字領域を特定する最小・最大座標(MIN_X, MIN_Y, MAX_X, MAX_Y)=(3,2,10,9)を出力する。
次いで、文字判定部105は、ラベル2について文字判定を行う。ラベル2は候補3及び候補4に含まれており、この中から最も高い類似度のものを選択する。(候補2についてはすでにラベル1が文字として確定しているため除外される。)候補3及び候補4の中では、ラベル2と4の組み合わせである候補4と、文字候補「い」との類似度が最も高いので、候補4は「い」であると判定する。そして、文字候補「い」の文字コードと共に、候補4の候補文字領域を特定する最小・最大座標(MIN_X, MIN_Y, MAX_X, MAX_Y)=(15,2,22,9)を出力する。
次いで、文字判定部105は、ラベル4について文字判定を行う。しかし、ラベル4については、既に候補4を構成するものとして文字判定が行われているので、次のラベル5について文字判定を行う。ラベル5は候補8及び候補9に含まれており、この中から最も高い類似度のものを選択する。(候補6及び候補7についてはラベル4が含まれていることから除外される。)候補8及び候補9の中では、ラベル5と3の組み合わせである候補9と、文字候補「う」との類似度が最も高いので、候補9は「う」であると判定する。そして、文字候補「う」の文字コードと共に、候補9の候補文字領域を特定する最小・最大座標(MIN_X, MIN_Y, MAX_X, MAX_Y)=(27,2,34,9)を出力する。
なお、ラベル5の次にはラベル3について文字判定が行われるが、ラベル3については、既に候補9を構成するものとして文字判定が行われているので除外され、文字判定は終了する。
本発明に係る画像処理装置、及び該画像処理装置を備える画像形成装置は、上述したような照合処理部104を有するので、パターンマッチング・類似度判定(文字認識)の高速化を図ることが出来る。例えば、本発明に係る画像形成装置(画像処理装置)では、図19に示すように、1回目の候補文字領域の一括取得では前記「候補矩形1」〜「候補矩形4」を一括取得するが、この際の第1読出しDMA104aによって取得されるデータ量は20×8=160画素分である。それに対して、「候補矩形1」〜「候補矩形4」を個別に取得すると、8×8+14×8+2×8+8×8=256画素分のデータ量となり、複数の候補文字領域(対象領域)の集まりとしてデータを取得した方が、記憶装置300からの転送の効率は良くなり、パターンマッチング・類似度判定の高速化を図ることが出来る。さらに、ライン切り替え時のオーバーヘッドを考慮すると、複数の候補文字領域の集まりとしてデータを取得した方がラインの切り替え回数は少なくなる(上記の例では複数の候補文字領域の集まりとして取得した場合は8回、個別の矩形として取得した場合は32回)ことから、転送の効率は良くなる。
(実施の形態2)
以下、本発明に係る画像処理装置を備えた画像読取装置について、通称フラットベッドスキャナを例として説明する。実施の形態2に係る画像読取装置は、実施の形態1の画像形成装置から一部を省略した構造である。
図28は本発明の実施の形態2に係る画像読取装置の要部構成を示すブロック図である。実施の形態2に係る画像読取装置は、制御装置(図示せず)、画像入力装置200、画像処理装置100、記憶装置(図示せず)及び操作パネル500等のハードウェアを備え、全体としてフラットベッドスキャナを構成している。
画像入力装置200は、原稿の画像を光学的に読取る読取手段であり、読取用の原稿に光を照射する光源、例えばCCD(Charge Coupled Device)のようなイメージセンサ等を備えている。画像入力装置200では、原稿からの反射光像を当該イメージセンサに結像させ、RGB(R : Red, G : Green, B : Blue)のアナログ電気信号を出力する。画像入力装置200が出力したアナログ電気信号は画像処理装置100に入力される。
画像処理装置100は、画像入力装置200を通じて入力されるアナログ電気信号を基にデジタル形式の画像データを生成し、画像の種類に応じた処理を施した後、出力用の画像データ(送信画像)を生成する。
画像処理装置100は、A/D変換部2、シェーディング補正部3、入力階調補正部4、圧縮処理部11、文字認識処理部1及びデータ変換部12を備えている。
画像入力装置200にて読み取られた画像データのアナログ信号は、画像処理装置100内を、A/D変換部2、シェーディング補正部3、入力階調補正部4、圧縮処理部11、文字認識処理部1、データ変換部12の順で送られるように構成されている。また、入力階調補正部4の後に分岐が行われており、入力階調補正部4からのデータは文字認識処理部1に出力されるように構成されている。
A/D(アナログ/デジタル)変換部2は、RGBのアナログ信号をデジタル信号に変換するもので、シェーディング補正部3は、A/D変換部2より送られてきたデジタルのRGB信号に対して、画像入力装置200の照明系、結像系、撮像系で生じる各種の歪みを取り除く処理を施す。
入力階調補正部4は、シェーディング補正部3から入力されたRGB信号(RGBの反射率信号)に対して、カラーバランスを整えると同時に、濃度信号等の画像処理装置100に採用されている画像処理システムの扱い易い信号に変換する変換処理を施すものである。
また、入力階調補正部4によって前記変換処理が行われたデータは、圧縮処理部11に入力され、圧縮処理部11では入力されるRGB信号に対して圧縮処理を行う。圧縮の方式としては例えばJPEG(Joint Photographic Experts Group)を使用する。また、文字認識処理部1では文字認識処理を行い、文字コード及び座標を出力する。データ変換部12では、これらのデータからPDF(Portable Document Format)のように送信出力に適したデータフォーマットに変換し、送信先に送信される。
文字認識処理部1は、実施の形態1の画像形成装置の文字認識処理部1と同様に、信号変換部、行切り出し部、領域画定部、照合処理部及び文字判定部を備えている。前記照合処理部は、領域切り抜き部、正規化処理部、入力特徴ベクトル格納部、パターンマッチング部(マッチング手段)、類似度格納部を夫々複数(例えば4ずつ)を備え、前記記憶装置からデータを取得する第1読出しDMA部を備えている。また、前記照合処理部は、実施の形態1の画像形成装置の文字認識処理部1と同様に、第2読出しDMA部、辞書バッファ及び辞書特徴ベクトル取得部をさらに備えている。
前記照合処理部は、複数の候補文字領域(対象領域)に対して並列してパターンマッチングを行う。つまり、前記照合処理部では、前記領域画定部によって画定された候補文字領域を、前記第1読出しDMA部が一括して複数取得し、一括して取得された複数の候補文字領域(対象領域)を候補文字領域毎に各領域切り抜き部へ切り抜き、各正規化処理部にて切り抜かれた対象領域に正規化を施した後、各候補文字領域に係る特徴ベクトルを検出して各入力特徴ベクトル格納部に格納する。各パターンマッチング部は、前記特徴ベクトルに基づき、パターンマッチング及び類似度の算出を行い、算出された類似度は各類似度格納部に格納される。尚、前記文字判定部は前記照合処理部によって算出された類似度に基づき、候補文字領域に係る文字の判定(文字認識)を行う。その他、詳細な内容は実施の形態1の記載と同様であり、詳しい説明を省略する。
また、前記辞書特徴ベクトル取得部は、前記辞書バッファに格納された辞書データを並列して複数のパターンマッチング部に供与し、各パターンマッチング部は同期して辞書データを取得することが出来る。
以上の記載においては、実施の形態2に係る画像読取装置として、フラットベッドスキャナを例として説明したが、これに限るものでなく、例えば、デジタルカメラに対しても適用することが可能である。
実施の形態1と同様の部分については、同一の符号を付して詳細な説明を省略する。
上記では、本発明に係る画像処理装置、画像読取装置及び画像形成装置がカラーの画像データに対応する場合を例として説明したが、これに限るものでなく、モノクロの画像データに対しても同様の効果が得られることは言うまでもない。
本発明の実施の形態1に係る画像形成装置の要部構成を示すブロック図である。 本発明の実施の形態1に係る画像形成装置の画像処理装置の要部構成を示すブロック図である。 本発明の実施の形態1に係る画像形成装置の文字認識処理部の要部構成を示すブロック図である。 本発明の実施の形態1に係る画像形成装置の信号変換部の要部構成を示すブロック図である。 混合フィルタの一例を示す例示図である。 本発明の実施の形態1に係る画像形成装置の照合処理部の要部構成を示すブロック図である。 特徴ベクトルの一例を示す例示図である。 「あ」、「い」、「う」の文字コード夫々に対応した辞書特徴ベクトルの一例を示す例示図である。 本発明の実施の形態1に係る画像形成装置の文字認識作用における、CPUの処理手順を示すフローチャートである。 本発明の実施の形態1に係る画像形成装置の文字認識作用における、CPUの処理手順を示すフローチャートである。 本発明の実施の形態1に係る画像形成装置の文字認識作用を説明するための原稿を示す説明図である。 ステップ102の処理によって生成されたヒストグラムを説明する説明図である。 ラスター走査方式の8連結によるラべリングを説明するための説明図である。 ラべリングの一例を示す例示図である。 図12のΔG1に係る領域に対しるラべリング処理の結果を示す図である。 ステップ104における座標特定の結果を示す図である。 ステップ105における候補文字領域の画定の結果を示す図である。 ステップ105における候補文字領域の画定の一例を説明するための例示図である。 ステップ108及びステップ109を説明するための説明図である。 ステップ108及びステップ109を説明するための説明図である。 ステップ108及びステップ109を説明するための説明図である。 正規化処理を説明するための説明図である。 正規化処理を説明するための説明図である。 正規化処理を説明するための説明図である。 類似度の算出過程の一例を示す例示図である。 全ての候補矩形に係る入力特徴ベクトルに対する類似度算出によって得られた結果を示す図表である。 誤った類似度算出の一例を示す例示図である。 本発明の実施の形態2に係る画像読取装置の要部構成を示すブロック図である。
符号の説明
1 文字認識処理部
100 画像処理装置
200 画像入力装置(画像読取手段)
104 照合処理部
104a 第1読出しDMA部(一括取得手段)
104e パターンマッチング部(マッチング手段)
104i 辞書特徴ベクトル取得部(供与手段)
300 記憶装置
800 制御装置

Claims (4)

  1. 入力画像から認識すべき文字を含む対象領域を取得し、該対象領域の特徴を示す特徴ベクトルと、予め記憶されている文字候補の特徴を示す辞書特徴ベクトルとのパターンマッチングを行い、文字を認識する画像処理装置において、
    複数の対象領域を一括して取得する一括取得手段と、
    一括して取得された各対象領域に対してパターンマッチングを並列して行う複数のマッチング手段と
    を備えていることを特徴とする画像処理装置。
  2. 前記辞書特徴ベクトルを取得し、前記複数のマッチング手段に夫々供与する供与手段を備えることを特徴とする請求項1に記載の画像処理装置。
  3. 画像を読み取る画像読取手段と、
    該画像読取手段によって読み取られた画像から前記対象領域を取得し、該対象領域の特徴ベクトルと、前記辞書特徴ベクトルとのパターンマッチングを行い、文字を認識する請求項1又は2に記載の画像処理装置と
    を備えていることを特徴とする画像読取装置。
  4. 請求項1又は2に記載の画像処理装置を備え、
    該画像処理装置による文字認識の結果に基づいて画像データを生成し、生成した画像データに応じて、シート上に画像を形成するように構成されていることを特徴とする画像形成装置。
JP2008305162A 2008-11-28 2008-11-28 画像処理装置、画像読取装置及び画像形成装置 Pending JP2010128966A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008305162A JP2010128966A (ja) 2008-11-28 2008-11-28 画像処理装置、画像読取装置及び画像形成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008305162A JP2010128966A (ja) 2008-11-28 2008-11-28 画像処理装置、画像読取装置及び画像形成装置

Publications (1)

Publication Number Publication Date
JP2010128966A true JP2010128966A (ja) 2010-06-10

Family

ID=42329290

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008305162A Pending JP2010128966A (ja) 2008-11-28 2008-11-28 画像処理装置、画像読取装置及び画像形成装置

Country Status (1)

Country Link
JP (1) JP2010128966A (ja)

Similar Documents

Publication Publication Date Title
US8351707B2 (en) Image processing apparatus, image forming apparatus, image processing system, and image processing method
US8165402B2 (en) Image processing method, image processing apparatus, image forming apparatus and storage medium
US8634650B2 (en) Image processing apparatus, image forming apparatus, image reading apparatus, and image processing method
US8351706B2 (en) Document extracting method and document extracting apparatus
US7903872B2 (en) Image-processing apparatus and method, computer program, and storage medium
JP5264831B2 (ja) 画像処理装置、画像読取装置、画像形成装置、画像処理方法、コンピュータプログラム及び記録媒体
US20090284801A1 (en) Image processing apparatus and image processing method
JP2009031876A (ja) 画像処理装置およびそれを備えた画像形成装置、画像読取装置、画像処理方法、画像処理プログラム、画像処理プログラムを記録した記録媒体
US10373030B2 (en) Image processing apparatus that executes halftone process on target image data including edge pixel
US11272074B2 (en) System, method, and storage medium for converting low-resolution image data into high-resolution image data using neural network
JP2010146185A (ja) 画像処理装置、画像読取装置、画像送信装置、画像処理方法、プログラムおよびその記録媒体
US8107728B2 (en) Image processing apparatus, image forming apparatus, image processing system, computer program and recording medium
US8670623B2 (en) Image processing apparatus, image conversion method, and computer-readable storage medium for computer program based on calculated degree of complexity
US7986838B2 (en) Image processing apparatus and image processing method
JP4487000B2 (ja) 画像処理装置、画像形成装置、画像処理方法、画像処理システム、画像処理プログラムおよびその記録媒体
JP2017130811A (ja) 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体
US8284460B2 (en) Image processing apparatus directed to image outline processing, image processing method of the same, and computer-readable storage medium storing instructions for performing image processing
US8441683B2 (en) Image processing apparatus, image processing method, and recording medium for correcting the density at an edge of an image to be printed
JP2008092541A (ja) 画像処理方法、画像処理装置、画像形成装置、コンピュータプログラム及び記録媒体
JP2010287178A (ja) 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体
JP2010128966A (ja) 画像処理装置、画像読取装置及び画像形成装置
JP2005191890A (ja) 画像処理装置、画像処理方法、画像処理プログラム、画像処理プログラムを記録した記録媒体、および画像処理装置を備えた画像形成装置
JPH11127353A (ja) 画像処理装置及び画像処理方法
JP2005175824A (ja) 画像処理方法、画像処理装置及び画像形成装置並びにコンピュータプログラム
JP6618307B2 (ja) 画像処理装置、画像形成装置、及び、解像度決定方法