JP2009265751A - 文字認識装置、光学式文字認識システム及び文字認識プログラム - Google Patents

文字認識装置、光学式文字認識システム及び文字認識プログラム Download PDF

Info

Publication number
JP2009265751A
JP2009265751A JP2008111509A JP2008111509A JP2009265751A JP 2009265751 A JP2009265751 A JP 2009265751A JP 2008111509 A JP2008111509 A JP 2008111509A JP 2008111509 A JP2008111509 A JP 2008111509A JP 2009265751 A JP2009265751 A JP 2009265751A
Authority
JP
Japan
Prior art keywords
character
character recognition
image
recognition
color component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008111509A
Other languages
English (en)
Inventor
Tomoya Igi
智也 井木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2008111509A priority Critical patent/JP2009265751A/ja
Publication of JP2009265751A publication Critical patent/JP2009265751A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】色で区別された文字画像に対して、精度よく文字認識する。
【解決手段】RGB画像メモリ10に記憶されているカラー画像に対して文字認識を行う制御部120を備え、制御部120は、カラー画像の色成分を抽出する色成分抽出手段32と、色成分抽出手段32が抽出した各色成分画像を組み合わせて合成する色成分画像合成手段34と、各色成分画像及び色成分画像合成手段34が合成した合成成分画像に対して、文字認識を行う文字認識手段38と、文字認識手段38が認識した各認識文字を用いて正読文字を判定する認識結果判定手段40とを備える。
【選択図】図1

Description

本発明は、カラー画像を文字認識する文字認識装置、光学式文字認識システム及び文字認識プログラムに関する。
帳票に記載された手書文字を文字認識する場合、枠線(罫線)に沿った文字を認識することが認識精度の点で好ましい。このため、予め帳票に枠線を手書文字(黒色)に使われない色でプレ印刷しておくことが多い。プレ印刷された帳票を文字認識するとき、カラー情報を用いて枠線をドロップアウトさせて手書文字を文字認識する技術が存在する。
例えば、特許文献1には、帳票の金額記入欄の記入枠、及び“金額”と“円”の文字を赤色で印刷し、氏名記入欄の記入枠、及び“氏名”の文字を青色で印刷し、更に、印鑑欄の記入枠、及び“印”の文字を青色で印刷し、CCD(Charge Coupled Device)カラーセンサで帳票を撮像し、不要な色をドロップアウトして、手書文字を認識する技術が開示されている。また、このドロップアウトは、赤,緑,青の画素データにアンド演算を施すことにより、文字枠等をすべて取り除いている。また、オア演算を施すことにより、文字枠等をすべて含む画像を得ている。
また、特許文献2には、枠線を構成する画素のRGB(Red Green Blue)それぞれの色成分のヒストグラムを作成し、ピークとなる点からドロップアウトカラーを求め、記憶しているカラー画像からドロップアウトカラーを除去して文字認識を行う技術が開示されている。
特開平6−243290号公報(段落0016) 特開2004−318588号公報(段落0027乃至0029)
特許文献1,2の技術は、記入枠(枠線)を含めた枠線内が単色で印刷されたプレ印刷を前提にしているため、枠線内が多色にプレ印刷されているものを正確に文字認識できなくなったり、認識精度が低下したりすることがある。
例えば、複数桁の枠線と、千円未満の切捨て用の印刷数字「0」を同色でプレ印刷することを考える。この場合、特許文献1の技術を用いて文字認識すると、枠線のみならず「0」の印刷数字もドロップアウトして、印刷数字を文字認識することができない。また、枠線と印刷数字とを異なる色でプレ印刷しても、千の桁の手書数字と印刷数字とを区別することができない。
また、千の桁、百万の桁を示す漢数字「千」、「百万」を含めて枠線内にプレ印刷することも行われる。この場合、「千」、「百万」の印刷文字画像を文字認識することなく、印刷数字「0」を文字認識することが好ましい。さらに、数字の手書を補助するための「8」を7本の直線で記載したプレ印刷と、このプレ印刷に沿って描いた手書数字と、枠線とを区別することも有用である。
そこで、本発明は、色で区別された文字画像に対して、精度よく文字認識することができる文字認識装置、光学式文字認識システム及び文字認識プログラムを提供することを課題とする。
前記課題を解決するため、本発明の一の手段は、記憶部に記憶されているカラー画像に対して文字認識を行う制御部を備えた文字認識装置であって、前記制御部は、前記カラー画像の色成分を抽出する色成分抽出手段と、前記色成分抽出手段が抽出した各色成分画像を組み合わせて合成する色成分画像合成手段と、各前記色成分画像及び前記色成分画像合成手段が合成した合成成分画像に対して、文字認識を行う文字認識手段と、前記文字認識手段が認識した各認識文字を用いて正読文字を判定する認識結果判定手段とを備えることを特徴とする。
これによれば、色成分毎に区別された複数の文字画像と、各色成分画像が組み合わせられた合成成分画像とが文字認識され、認識文字を用いて正読文字が判定される。
例えば、カラー印刷されたプレ印刷の印刷数字と、黒色の手書数字とから、数字画像と、手書数字画像と、これらの合成成分画像とのそれぞれが文字認識される。この場合は、プレ印刷の数字画像と黒色の手書数字画像とが組み合わされたものと、合成成分画像が文字認識されたものとの一致で正読文字が判定される。
また、プレ印刷の属性(文字、アラビア数字、漢数字、枠線等の区別)とプレ印刷の色とが区別されていることにより、文字認識を行うときの参照文字画像の属性と抽出する色成分とが区別される。また、認識文字とは、文字認識の確度の値が所定値以上である文字である。そして、確度の値が所定値未満である文字は、不読文字として認識文字から除かれ、空白「 」は、空白文字として認識文字から除かれている。
本発明の他の手段は、記憶部に記憶されているカラー画像に対して文字認識を行う制御部を備えた文字認識装置であって、前記制御部は、前記カラー画像の色成分を抽出する色成分抽出手段と、前記色成分抽出手段で抽出された各色成分画像に対して、文字認識を行う文字認識手段と、前記文字認識手段が認識した各認識文字を組み合わせる認識文字組合わせ手段とを備えることを特徴とする。
これによれば、色成分毎に区別された複数の文字画像が文字認識され、これらの認識文字が組み合わされて、元のカラー画像に含まれる文字画像の全体が認識される。例えば、カラー印刷されたプレ印刷の数字と黒色の手書数字とが区別して文字認識され、これらの認識文字が組み合わされるので、数字の全体が認識される。
本発明のさらに他の手段は、記憶部に記憶されているカラー画像に対して文字認識を行うコンピュータに実行させる文字認識プログラムであって、前記カラー画像の色成分を抽出する色成分抽出ステップと、前記色成分抽出ステップで抽出した各色成分画像を組み合わせて合成する色成分画像合成ステップと、各前記色成分画像及び前記色成分画像合成ステップで合成した合成成分画像に対して、文字認識を行う文字認識ステップと、前記文字認識ステップが認識した各認識文字を用いて正読文字を判定する認識結果判定ステップと、を実行させることを特徴とする。
本発明によれば、色で区別された文字画像に対して、精度よく文字認識することができる。
(第1実施形態)
本発明の一実施形態である光学式文字認識システムの構成について図1を参照して説明する。
図1の光学式文字認識システム250は、文字認識装置200と、画像入力装置210と、入力装置220と、出力装置230とを備え、画像入力装置210でプレ印刷された帳票240が読み取られ、文字認識装置200で帳票240に記載された手書文字が認識される。なお、帳票240は、地色(背景色)が白であり、プレ印刷の属性(アラビア数字、漢数字、文字、記号、枠線等による区別)によって、異なる色で印刷されている。
画像入力装置210は、例えば、スキャナであり、CCD式のラインセンサを軸方向と直角方向に移動させつつ、カラー画像のデータを文字認識装置200に伝送する。このラインセンサは、R(中心波長700nm),G(中心波長546.1nm),B(中心波長435.8nm)のカラーフィルタが各画素に設けられ、画素毎にR,G,Bのデータを出力する。このとき、自然光が帳票240の白地部分に照射されると、全波長で略均一の光が反射(散乱)し、この反射光がラインセンサに入射し、ラインセンサにより赤(R)、緑(G)、青(B)のすべての色成分が検出される。また、自然光が帳票240の赤色の部分に入射すると、自然光の内、赤色の光が反射し、青色及び緑色の光が帳票240で吸収される。このため、ラインセンサが赤色(R)のみの光を検出する。同様に、自然光が緑色の部分に入射すると、ラインセンサが緑色の反射光を検出し、自然光が青色の部分に入射すると、ラインセンサが青色の反射光を検出する。また、自然光が帳票240の黒色の文字(手書文字)の部分に入射すると、全波長の光を吸収し、ラインセンサは、略ゼロの値を出力する。
入力装置220は、操作者がキーボード、マウス等を用いて入力操作するものであり、例えば、認識対象領域の矩形座標等が入力される。出力装置230は、CRT(Cathode Ray Tube)、LCD(Liquid Crystal Display)等による表示装置であり、帳票画像や文字認識結果を表示すると共に、入力操作を誘導する誘導画面を表示する。
文字認識装置200は、入力I/F110、出力I/F130、制御部120、及び記憶部100を備えるコンピュータである。
入力I/F110は、例えば、USB(Universal Serial Bus)ポートであり、画像入力装置210のカラー画像信号、及び入力装置220からの入力信号を受け付ける。出力I/F130は、図示しない画像メモリを内蔵し、記憶された画像データを映像信号に変換して出力装置230に出力する。制御部120は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等により構成され、記憶部100に記憶されているプログラムを実行する。なお、文字認識装置200がPC(Personal Computer)により構成される場合には、ROMにイニシャルプログラムローダが記憶されており、HDD(Hard Disc Drive)に記憶されたOS(Operating System)及びプログラムがRAMに展開されて実行される。
記憶部100は、ROM又はHDD並びにRAMにより構成されており、メモリ領域、及びプログラム領域に分割されている。メモリ領域は、RGB画像メモリ10、色成分画像メモリ15、及びフォーマットDB20に再分割され、プログラム領域は、画像入力制御手段30、色成分抽出手段32、色成分画像合成手段34、レイアウト解析手段36、文字認識手段38、認識結果判定手段(認識文字組合わせ手段)40、特徴距離計算手段42、出力制御手段44及びフォーマットDB作成手段46を制御部120に実現させるプログラムが記憶されている。
画像入力制御手段30は、入力I/F110を介して画像入力装置210を制御するためのプログラムであり、入力装置220からのトリガ信号を契機として、ラインセンサをスキャンし、読み込まれたカラー画像(読取画像,帳票画像)をRGB画像メモリ10に記憶する制御を行う。さらに、画像入力制御手段30は、帳票240の読取画像及び誘導画面を出力装置230に表示して、入力装置220を用いて認識対象領域の矩形座標を指定させる制御を行う。
RGB画像メモリ10は、スキャンされたカラー画像がR,G,Bの色成分毎に記憶されている。これから、制御部120は、カラー画像の各画素の色度座標(r,g,b)=(R/(R+G+B),G/(R+G+B),B/(R+G+B))を得ることができる。なお、(r,g)あるいは、所定の座標変換を行った(x、y)を色度座標と云うことも多い。色成分画像メモリ15は、赤,緑,青,黒の単色、及びこれらの組合わせ色(赤+緑),(黒+緑),(赤+緑),・・・,(青+赤+緑+黒)で、単色の二値画像を合成した合成画像が記憶されている。
色成分抽出手段32は、RGB画像メモリ10に記憶されたカラー画像の色度座標(r,g,b)を画素毎に演算し、カラー画像から単色、及び組合わせ色の二値画像を抽出する。
例えば、赤の画素は、色度座標r=1であって、色度座標g=b=0の画素である。同様に、緑の画素は色度座標g=1であって、色度座標b=r=0の画素であり、青の画素は色度座標b=1であって、色度座標r=g=0の画素である。また、黒の画素は、r=g=b=0(R=G=B=0)の画素である。ここで、背景色(白)は、r=g=b=1/3(R=G=B)の画素であるので、閾値を1/2に設定すれば、赤、緑、青の画素を抽出するときに白色(背景色)の画素が除去される。
色成分画像合成手段34は、単色(赤、緑、青、黒)の二値画像を合成して、組合わせ色((赤+緑),(黒+緑),(赤+黒),・・・,(青+赤+緑+黒))の二値画像を得る。すなわち、組合わせ色(赤+緑)の合成画像は、赤の二値画像と緑の二値画像とを加算した二値画像である。同様に、(黒+緑),(赤+黒),・・・,(青+赤+緑+黒)の二値画像が得られる。なお、これらの二値画像の組合わせは、4色の場合で2−1=15通りである。
図2の説明図を用いて具体例を説明する。認識対象領域300には、赤色の印刷数字「000」310aと、千の桁を表す緑色の上付文字「」310bと、青色の4桁の枠線310cと、黒色の手書数字「2」310dとが記載されている。
これにより、色成分画像メモリ15の赤領域には、印刷数字「 000」の画像320aが記憶され、緑領域には、上付文字「 」の画像320bが記憶され、青領域には、4桁の枠線の画像320cが記憶され、黒領域には、手書数字「2 」の画像320dが記憶される。また、(赤+緑)の領域には、上付文字「 」と印刷数字「 000」とを合成した「000」の画像320eが記憶され、(黒+緑)の領域には、手書数字「2 」と上付文字「 」との合成画像320fが記憶され、(赤+黒)の領域には手書数字「2 」と印刷数字「 000」との合成画像320gが記憶され、(赤+青+緑+黒)の領域には、認識対象領域300と同一の合成画像320hが記憶されている。
フォーマットDB20には、帳票240のフォーマットや、参照文字画像としての文字パターンが記憶されており、例えば、帳票240のフォーマットとして、認識対象領域の矩形座標や認識対象領域内の文字のレイアウトが格納されている。また、フォーマットDB20には、帳票のプレ印刷の属性に対応するように、参照文字画像の属性(この例では、アラビア数字、漢数字の区別)も記憶されている。
レイアウト解析手段36は、帳票240の認識対象領域に記載されている複数の文字のレイアウトを解析するものであり、例えば、認識対象領域内の画素の縦横のヒストグラムを解析することによって文字のレイアウトを決定する。また、レイアウト解析手段36は、RGB画像メモリ10に記憶された画像データから特徴情報を抽出し、認識対象領域の矩形座標を解析することもでき、枠線の位置、各文字領域の位置等の解析結果をフォーマットDB20に記憶する。
フォーマットDB作成手段46は、帳票画像を出力装置230に表示し、入力装置220を用いて帳票240の認識対象領域を操作者に入力させ、入力された認識対象領域の矩形座標をフォーマットDB20に記憶するものである。
文字認識手段38は、色成分画像メモリ15に記憶された単色、及び組合わせ色の二値画像から切り出した各々の文字画像に対して文字認識を行う。ここで、文字認識手段38は、例えば、文字画像(認識対象画像)とフォーマットDB20に記憶されている参照文字画像とを比較し、距離情報(文字認識の確度の値)が所定値以上である文字を認識文字(例えば、「2」)とし、距離情報が所定値未満である文字を不読文字「?」とし、空白「 」を空白文字「(SP)」として、認識文字結果を出力する。なお、文字の画像同士を比較するのではなく、文字毎の線分の方向や長さ等の特徴を文字認識用特徴情報として記憶しておき、認識対象の文字画像から同様にして特徴を抽出して、比較するようにしてもよい。また、これら認識用の情報は、フォーマットDB20ではなく認識用辞書データとして別に記憶しておいても良い。
具体的に、図2において、印刷数字「 000」の画像320aは、「(SP)000」330aと文字認識され、「0」が認識文字である。また、上付文字「 」の画像320bは、「?(SP)(SP)(SP)」330bと認識され、4桁の枠線の画像320cは「????」330cと認識され、手書数字「2 」の画像320dは「2(SP)(SP)(SP)」330dと認識され、「2」が認識文字である。「000」の画像320eは「?000」330eと認識される。手書数字「2 」と上付文字「 」との合成画像320fは、例えば、「8(SP)(SP)(SP)」330fと誤認識され、「8」が認識文字である。また、手書数字「2 」と印刷数字「 000」との合成画像320gは「2000」330gと認識され、認識対象領域300と同一の画像320hは「????」330hと認識される。
ここで、比較例として、多色印刷されたプレ印刷から単色の枠線をドロップアウトして、文字認識する例を説明する。
図3の認識対象領域300には、図2と同様に、赤色の印刷数字「000」310aと、緑色の上付文字「」310bと、青色の4桁の枠線310cと、黒色の手書数字「2」310dとが記載されている。この認識対象領域300の画像から青色の4桁の枠線310cをドロップアウトすると、ドロップアウト画像350が得られる。このドロップアウト画像350の画素の明度((R+G+B)/3)を二値化して文字認識すると、例えば、文字認識結果「8000」360と誤認識しやすい。すなわち、上付文字「」と手書数字「2」との合成画像が認識文字「8」と誤認識されている。
図1の特徴距離計算手段42は、認識対象画像と認識文字との特徴距離(距離情報)を演算する。例えば、手書文字「2」の認識対象画像と認識文字「2」との特徴距離を演算する。この場合、手書文字「2」と上付文字「」との合成画像(認識対象画像)と認識文字「8」との特徴距離は、認識対象文字「2」と認識結果「2」との特徴距離よりも大きい。
認識結果判定手段40は、文字認識手段38が認識した複数の文字認識結果から、1つの認識結果を選択する。このとき、各文字認識結果の各文字領域に認識文字と空白文字「(SP)」とが含まれている場合には、認識文字を選択し、各文字認識結果に認識文字と不読文字「?」とが含まれている場合には、認識文字を選択し、各文字認識結果に空白文字「(SP)」と不読文字「?」とが含まれている場合には、空白文字「(SP)」を選択する。ここで、認識文字には、空白文字「(SP)」と不読文字「?」との何れも含まれない。また、認識結果判定手段40は、複数の合成画面の文字認識により、複数の異なる認識文字が得られたら、特徴距離(距離情報)を演算して、特徴距離が短い方の認識文字を選択する。また、数が多い方の認識文字を選択してもよい。
具体的に、図2において、符号330a乃至330hの最左端の認識結果は、「(SP)」,「?」,「?」,「2」,「?」,「8」,「2」,「?」であり、2つの認識文字「8」「2」が得られる。このように認識文字が複数となるときには、特徴距離計算手段42が計算した特徴距離が短い方を選択し、認識文字「2」が選択される。また、認識文字「8」が1個に対して、認識文字「2」は2個であるので、数量が多い方の認識文字「2」を選択することもできる。さらに、最左端を除いて2文字目から右端端までの認識結果は、「000」,「(SP)(SP)(SP)」,「???」,「(SP)(SP)(SP)」,「000」,「(SP)(SP)(SP)」,「000」,「???」であり、認識文字が優先して選択され、「000」の文字が選択される。すなわち、認識結果判定手段40は、異なる合成画像を文字認識した認識文字を組み合わせることにより、4桁の文字枠すべての認識文字を「2000」と正読する。
また、他の例として、色成分画像を合成しない例について説明する。すなわち、文字認識手段38が、320a乃至320dの各画像のみを文字認識して、認識結果330a乃至330dを出力する場合である。最左端の認識結果は、「(SP)」,「?」,「?」,「2」であり、認識文字「2」が選択される。また、最左端を除いて2列目から最右端までの認識結果は、「000」,「(SP)(SP)(SP)」,「???」,「(SP)(SP)(SP)」であり、文字「000」が選択される。すなわち、認識文字組合わせ手段(認識結果判定手段40)は、これらの認識文字を組み合わせることにより、4桁の文字枠すべての認識文字を「2000」と正読する。すなわち、プレ印刷の属性(アラビア数字、漢数字、枠線の区別)によって印刷色を区別することにより、正しく認識される。言い換えれば、印刷色の区別により、参照文字画像の属性と抽出色とが区別される。
出力制御手段44は、帳票画像、認識エリア内の画像、色成分画像メモリ15内の各色成分画像、認識文字等を、入力装置220の制御に従い、出力I/F130に出力するように制御するものであり、これらの画像が出力装置230に表示される。また、出力制御手段44は、認識文字を外部にテキストデータとして出力する。
次に、文字認識装置200の動作を図4,図5のフローチャートを用いて説明する。
図4は、フォーマットDB20作成時のフローチャートであり、図5は、文字認識時のフローチャートである。
図4は、白地に多色でプレ印刷された帳票240を画像入力装置210(図1)に載置して、入力装置220(図1)からの起動信号により実行されるフローを示している。
まず、画像入力制御手段30は、画像入力装置210に対して登録画像の取得を行わせる(S2)。これにより、画像入力装置210から帳票240のカラー画像が取り込まれ、このカラー画像が多値データとしてRGB画像メモリ10に記憶される。
次に、制御部120は、画像入力制御手段30により、画像入力装置210から入力された矩形座標に基づいて、認識対象領域の矩形座標を設定する(S4)。具体的には、制御部120は、画像入力制御手段30により、RGB画像メモリ10に記憶された帳票240の画像データ、及び入力操作誘導画面を出力装置230に表示する。そして、操作者が入力装置220を用いて認識対象領域の矩形座標、及び認識対象領域内の文字、罫線等を指定する。さらに、制御部120は、画像入力制御手段30により、指定された認識対象領域の矩形座標、文字種、及び文字、罫線等の色情報をフォーマットDB20に記憶し、フォーマットDB20が作成され(S6)、このルーチンが終了する。なお、フォーマットDB20には、予め、参照用の文字パターン(参照文字画像)が記憶されている。
図5は、文字認識時のフローであり、図4と同様に帳票240を画像入力装置210(図1)に載置して実行されるフローであるが、フォーマットが同種類の帳票240について繰り返して実行される。
まず、制御部120は、画像入力制御手段30により、画像入力装置210から読取画像(カラー画像)を取得し(S12)、取得した読取画像の画像データをRGB画像メモリ10に記憶する。次に、制御部120は、画像入力制御手段30により、フォーマットDB20から認識対象領域の矩形データ、認識対象領域内の文字種のデータを読み込む(S14)。
次に、制御部120は、画像入力制御手段30により、フォーマットDB20に記憶されている認識対象領域の矩形データを用いて認識対象領域の設定を行う(S16)。そして、制御部120は、色成分抽出手段32により、認識対象領域内の色成分を抽出する(S18)。すなわち、制御部120は、RGB画像メモリ10に記憶されたカラー画像から認識領域内で単色成分(赤,青,緑,黒)の二値画像を抽出し、抽出した二値画像を色成分画像メモリ15(図1)の赤,青,緑,黒の各領域に記憶する。
そして、制御部120は、色成分画像合成手段34により、色成分画像メモリ15の赤、青、緑、黒の各領域に記憶された二値画像(単色画像)を組み合わせて、色成分画像を合成し(S20)、合成された合成画像を色成分画像メモリ15(図1)の(赤+緑),(黒+緑),(赤+黒),・・・,(青+赤+緑+黒)の各領域に記憶する。
そして、制御部120は、レイアウト解析手段36により、認識対象領域内の複数文字のレイアウトを解析し、文字認識手段38により、すべての単色画像、及び合成された色成分画像に対して文字認識を行う(S22)。そして、制御部120は、認識結果判定手段40により、各色成分画像に対する文字認識結果を用いて、認識結果を判定する(S24)。このとき、認識文字が複数存在していたときには、制御部120は、特徴距離計算手段42により計算された特徴距離が短い方の認識文字を選択する。また、制御部120は、数が多い方の認識文字を選択してもよい。そして、制御部120は、出力制御手段44により選択された認識文字を出力装置230に出力し(S26)、このルーチンを終了する。
図6は、前記した比較例のフローチャートである。この比較例は、記憶部100の内部構成を除いて図1の構成と同様であるので、以下の説明も制御部120の動作として説明する。
図5と同様に、まず、制御部120は、読取画像(カラー画像)を取得し(S30)、フォーマットDB20を読み込み(S32)、認識対象領域を設定し(S34)、読取画像から認識対象領域を切り出す。そして、制御部120は、色情報を用いて、認識対象領域の画像から枠線の画像のドロップアウトを行う(S36)。そして、制御部120は、枠線をドロップアウトした認識対象領域の画素の明度を二値化した二値画像(ドロップアウト画像)に対して文字認識を行う(S38)。そして、制御部120は、認識結果を表示装置230に出力し(S40)、このルーチンを終了する。
これによれば、図2に示したように、印刷数字の「0」は正しく認識されるが、手書数字の「2」と漢数字「千」の上付文字との合成画像は「8」と誤認識されやすい。誤認識された場合、正読文字が認識されていないので、認識精度を向上させることが困難である。しかしながら、前記した実施形態によれば、手書き数字のみが正読される場合と(図2の330d,330g)、合成画像が誤認識される場合(図2の330f)との双方が得られ、特徴距離を比較したり、数を比較したりすることにより、認識精度を向上させることができる。
(変形例)
本発明は前記した実施形態に限定されるものではなく、例えば以下のような種々の変形が可能である。
(1)前記各実施形態は、色度座標(r,g,b)の二値化処理により、R,G,Bのカラー画像から赤,緑,青,黒の二値画像を抽出したが、中間色(黄色,水色(シアン),紫(マゼンタ))の二値画像を抽出することもできる。このため、計6色でプレ印刷された帳票240の文字認識が可能である。
すなわち、r=g=1/2、b=0の場合が「黄」であり、r=0、g=b=1/2の場合が「水色」であり、r=b=1/2、g=0の場合が「紫」である。なお、前記したように、r=1、g=b=0の場合が「赤」であり、b=1、r=g=0の場合が「青」であり、g=1、r=b=0の場合が「緑」であり、R=G=B(r=g=b=1/3)の場合が「白」であり、R=G=B=0の場合が「黒」である。なお、色度座標r,g,bは、0,1/3,1/2,1に等しいだけでなく、略等しい場合でも構わない。
また、赤、青及び緑の中で何れか2色と、この2色の中間色とのプレ印刷であれば、色度座標(r,g,b)の組合わせで、この2色と中間色と黒色とを区別可能である。
例えば、赤色と緑色と中間色(黄色)とでプレ印刷した場合を考えると、
r=g=1/2、b=0の場合が「黄」であり、r=1、g=b=0の場合が「赤」であり、b=1、r=g=0の場合が「青」であり、g=1、r=b=0の場合が「緑」であり、r=g=b=1/3の場合が「白」であり、r=g=b=0の場合が「黒」である。
(2)前記実施形態では、上付文字「」と手書数字「2」との合成画像を例としたが、7本の直線のみで構成された数字記入用のプレ印刷400(図7)を用いることがある。例えば、このプレ印刷400の複数の破線a,b,c,d,e,f,gに沿うようにして任意の数字を手書きすることが行われる。この場合、手書きされていない状態でプレ印刷画像を文字認識すると「8」が認識される。また、一部の直線が手書きされ、手書きされない他の破線は、不読文字と判定されるのが原則であるが、破線a,b,e,f,gに沿って「3」を手書きした場合の他の破線c,dは、「1」と誤認識されやすい。このため、プレ印刷の属性に応じて、対応色の認識文字を認識結果の判定に用いるか否かの判断を行うことが好ましい。
本発明の一実施形態である光学式文字認識システムの構成図である。 本実施形態の文字認識を説明するための図である。 比較例の文字認識を説明するための図である。 本実施形態におけるフォーマットDB作成時のフローチャートである。 本実施形態における文字認識時のフローチャートである。 比較例における文字認識時のフローチャートである。 数字記入用プレ印刷の例である。
符号の説明
10 RGB画像メモリ
15 色成分画像メモリ
30 画像入力制御手段
32 色成分抽出手段
34 色成分画像合成手段
36 レイアウト解析手段
38 文字認識手段
40 認識結果判定手段(認識文字組合わせ手段)
42 特徴距離計算手段
44 出力制御手段
46 フォーマットDB作成手段
100 記憶部
110 入力I/F
120 制御部
130 出力I/F
200 文字認識装置
210 画像入力装置
220 入力装置
230 出力装置
240 帳票
250 光学式文字認識システム
300 認識対象領域

Claims (14)

  1. 記憶部に記憶されているカラー画像に対して文字認識を行う制御部を備えた文字認識装置であって、
    前記制御部は、
    前記カラー画像の色成分を抽出する色成分抽出手段と、
    前記色成分抽出手段が抽出した各色成分画像を組み合わせて合成する色成分画像合成手段と、
    各前記色成分画像及び前記色成分画像合成手段が合成した合成成分画像に対して、文字認識を行う文字認識手段と、
    前記文字認識手段が認識した各認識文字を用いて正読文字を判定する認識結果判定手段とを備える
    ことを特徴とする文字認識装置。
  2. 記憶部に記憶されているカラー画像に対して文字認識を行う制御部を備えた文字認識装置であって、
    前記制御部は、
    前記カラー画像の色成分を抽出する色成分抽出手段と、
    前記色成分抽出手段で抽出された各色成分画像に対して、文字認識を行う文字認識手段と、
    前記文字認識手段が認識した各認識文字を組み合わせる認識文字組合わせ手段とを備えることを特徴とする文字認識装置。
  3. 前記文字認識手段は、前記記憶部に記憶されている参照文字画像と比較して前記文字認識を行うものであり、
    前記参照文字画像の属性と前記色成分抽出手段が抽出する色成分とが対応づけられていることを特徴とする請求項1又は請求項2に記載の文字認識装置。
  4. 前記文字認識手段は、1文字毎に文字認識を行い、
    前記認識結果判定手段は、何れかの文字領域で複数の認識文字が得られた場合には、前記文字認識の確度情報を参照して、何れかの認識文字を正読文字として判定することを特徴とする請求項1乃至請求項3の何れか1項に記載の文字認識装置。
  5. 前記文字認識の確度情報は、前記文字認識の参照文字画像と前記文字領域の文字画像との間の距離情報であり、
    前記認識結果判定手段は、前記距離情報が短い方の認識文字を正読文字として判定することを特徴とする請求項4に記載の文字認識装置。
  6. 前記文字認識の確度情報は、前記認識文字の数であり、
    前記認識結果判定手段は、前記数が多い方の認識文字を正読文字として判定することを特徴とする請求項4に記載の文字認識装置。
  7. 前記認識結果判定手段は、前記文字認識手段の各文字認識結果に認識文字と空白文字とが含まれている場合には、認識文字を選択することを特徴とする請求項1乃至請求項6の何れか1項に記載の文字認識装置。
  8. 前記認識結果判定手段は、前記文字認識手段の各文字認識結果に認識文字と不読文字とが含まれている場合には、認識文字を選択することを特徴とする請求項1乃至請求項7の何れか1項に記載の文字認識装置。
  9. 前記認識結果判定手段は、前記文字認識手段の各文字認識結果に空白文字と不読文字とが含まれている場合には、空白文字を選択することを特徴とする請求項1乃至請求項7の何れか1項に記載の文字認識装置。
  10. 前記不読文字は、前記文字認識手段の文字認識の確度情報の値が所定値未満である文字であることを特徴とする請求項8又は請求項9に記載の文字認識装置。
  11. 前記文字認識手段は、前記記憶部に記憶されている参照文字画像と比較して前記文字認識を行うものであり、
    前記認識結果判定手段は、前記参照文字画像の属性に応じて、前記各認識文字の何れかを判定対象から除外することを特徴とする請求項1又は請求項2に記載の文字認識装置。
  12. 前記文字認識手段は、前記記憶部に記憶されている参照文字画像と比較して前記文字認識を行うものであり、
    前記色成分抽出手段は、前記参照文字画像の属性に応じて、前記色成分を抽出するか否かが決められていることを特徴とする請求項1又は請求項2に記載の文字認識装置。
  13. 帳票画像を光学式に入力する画像入力装置と、請求項1乃至請求項12の何れか1項に記載の文字認識装置とが接続され、
    前記文字認識装置は、前記画像入力装置が入力したカラー画像を前記記憶部に記憶して、前記文字認識を行うことを特徴とする光学式文字認識システム。
  14. 記憶部に記憶されているカラー画像に対して文字認識を行うコンピュータに実行させる文字認識プログラムであって、
    前記カラー画像の色成分を抽出する色成分抽出ステップと、
    前記色成分抽出ステップで抽出した各色成分画像を組み合わせて合成する色成分画像合成ステップと、
    各前記色成分画像及び前記色成分画像合成ステップで合成した合成成分画像に対して、文字認識を行う文字認識ステップと、
    前記文字認識ステップが認識した各認識文字を用いて正読文字を判定する認識結果判定ステップと、
    を実行させることを特徴とする文字認識プログラム。
JP2008111509A 2008-04-22 2008-04-22 文字認識装置、光学式文字認識システム及び文字認識プログラム Pending JP2009265751A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008111509A JP2009265751A (ja) 2008-04-22 2008-04-22 文字認識装置、光学式文字認識システム及び文字認識プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008111509A JP2009265751A (ja) 2008-04-22 2008-04-22 文字認識装置、光学式文字認識システム及び文字認識プログラム

Publications (1)

Publication Number Publication Date
JP2009265751A true JP2009265751A (ja) 2009-11-12

Family

ID=41391562

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008111509A Pending JP2009265751A (ja) 2008-04-22 2008-04-22 文字認識装置、光学式文字認識システム及び文字認識プログラム

Country Status (1)

Country Link
JP (1) JP2009265751A (ja)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9068699B2 (en) 2007-04-19 2015-06-30 Brandeis University Manipulation of fluids, fluid components and reactions in microfluidic systems
US9228229B2 (en) 2010-02-12 2016-01-05 Raindance Technologies, Inc. Digital analyte analysis
US9328344B2 (en) 2006-01-11 2016-05-03 Raindance Technologies, Inc. Microfluidic devices and methods of use in the formation and control of nanoreactors
US9366632B2 (en) 2010-02-12 2016-06-14 Raindance Technologies, Inc. Digital analyte analysis
US9440232B2 (en) 2007-02-06 2016-09-13 Raindance Technologies, Inc. Manipulation of fluids and reactions in microfluidic systems
US9562837B2 (en) 2006-05-11 2017-02-07 Raindance Technologies, Inc. Systems for handling microfludic droplets
US10351905B2 (en) 2010-02-12 2019-07-16 Bio-Rad Laboratories, Inc. Digital analyte analysis
US10639597B2 (en) 2006-05-11 2020-05-05 Bio-Rad Laboratories, Inc. Microfluidic devices
US10647981B1 (en) 2015-09-08 2020-05-12 Bio-Rad Laboratories, Inc. Nucleic acid library generation methods and compositions
US11077415B2 (en) 2011-02-11 2021-08-03 Bio-Rad Laboratories, Inc. Methods for forming mixed droplets
US11168353B2 (en) 2011-02-18 2021-11-09 Bio-Rad Laboratories, Inc. Compositions and methods for molecular labeling
US11174509B2 (en) 2013-12-12 2021-11-16 Bio-Rad Laboratories, Inc. Distinguishing rare variations in a nucleic acid sequence from a sample
US11187702B2 (en) 2003-03-14 2021-11-30 Bio-Rad Laboratories, Inc. Enzyme quantification
US20220189186A1 (en) * 2020-12-10 2022-06-16 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and non-transitory storage medium
US11390917B2 (en) 2010-02-12 2022-07-19 Bio-Rad Laboratories, Inc. Digital analyte analysis
US11511242B2 (en) 2008-07-18 2022-11-29 Bio-Rad Laboratories, Inc. Droplet libraries
US11635427B2 (en) 2010-09-30 2023-04-25 Bio-Rad Laboratories, Inc. Sandwich assays in droplets
US11786872B2 (en) 2004-10-08 2023-10-17 United Kingdom Research And Innovation Vitro evolution in microfluidic systems
US11901041B2 (en) 2013-10-04 2024-02-13 Bio-Rad Laboratories, Inc. Digital analysis of nucleic acid modification
US11898193B2 (en) 2011-07-20 2024-02-13 Bio-Rad Laboratories, Inc. Manipulating droplet size

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06251192A (ja) * 1993-02-26 1994-09-09 Toshiba Corp 光学的文字読み取り装置
JPH07261918A (ja) * 1994-03-18 1995-10-13 Pfu Ltd 情報入力装置および手書き文字処理方法
JP2000148908A (ja) * 1998-11-17 2000-05-30 Ricoh Co Ltd 文書画像処理方法、装置および記録媒体
JP2000163511A (ja) * 1998-11-24 2000-06-16 Hitachi Ltd 光学文字読取装置
JP2004199141A (ja) * 2002-12-16 2004-07-15 Nec Saitama Ltd 記号認識装置及び記号認識方法
JP2005309819A (ja) * 2004-04-22 2005-11-04 Nec Corp 図形読み取り方法及びその装置並びに主要色抽出方法及びその装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06251192A (ja) * 1993-02-26 1994-09-09 Toshiba Corp 光学的文字読み取り装置
JPH07261918A (ja) * 1994-03-18 1995-10-13 Pfu Ltd 情報入力装置および手書き文字処理方法
JP2000148908A (ja) * 1998-11-17 2000-05-30 Ricoh Co Ltd 文書画像処理方法、装置および記録媒体
JP2000163511A (ja) * 1998-11-24 2000-06-16 Hitachi Ltd 光学文字読取装置
JP2004199141A (ja) * 2002-12-16 2004-07-15 Nec Saitama Ltd 記号認識装置及び記号認識方法
JP2005309819A (ja) * 2004-04-22 2005-11-04 Nec Corp 図形読み取り方法及びその装置並びに主要色抽出方法及びその装置

Cited By (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11187702B2 (en) 2003-03-14 2021-11-30 Bio-Rad Laboratories, Inc. Enzyme quantification
US11786872B2 (en) 2004-10-08 2023-10-17 United Kingdom Research And Innovation Vitro evolution in microfluidic systems
US9328344B2 (en) 2006-01-11 2016-05-03 Raindance Technologies, Inc. Microfluidic devices and methods of use in the formation and control of nanoreactors
US9410151B2 (en) 2006-01-11 2016-08-09 Raindance Technologies, Inc. Microfluidic devices and methods of use in the formation and control of nanoreactors
US9534216B2 (en) 2006-01-11 2017-01-03 Raindance Technologies, Inc. Microfluidic devices and methods of use in the formation and control of nanoreactors
US10639597B2 (en) 2006-05-11 2020-05-05 Bio-Rad Laboratories, Inc. Microfluidic devices
US9562837B2 (en) 2006-05-11 2017-02-07 Raindance Technologies, Inc. Systems for handling microfludic droplets
US11351510B2 (en) 2006-05-11 2022-06-07 Bio-Rad Laboratories, Inc. Microfluidic devices
US11819849B2 (en) 2007-02-06 2023-11-21 Brandeis University Manipulation of fluids and reactions in microfluidic systems
US9440232B2 (en) 2007-02-06 2016-09-13 Raindance Technologies, Inc. Manipulation of fluids and reactions in microfluidic systems
US10603662B2 (en) 2007-02-06 2020-03-31 Brandeis University Manipulation of fluids and reactions in microfluidic systems
US11618024B2 (en) 2007-04-19 2023-04-04 President And Fellows Of Harvard College Manipulation of fluids, fluid components and reactions in microfluidic systems
US9068699B2 (en) 2007-04-19 2015-06-30 Brandeis University Manipulation of fluids, fluid components and reactions in microfluidic systems
US10675626B2 (en) 2007-04-19 2020-06-09 President And Fellows Of Harvard College Manipulation of fluids, fluid components and reactions in microfluidic systems
US10357772B2 (en) 2007-04-19 2019-07-23 President And Fellows Of Harvard College Manipulation of fluids, fluid components and reactions in microfluidic systems
US10960397B2 (en) 2007-04-19 2021-03-30 President And Fellows Of Harvard College Manipulation of fluids, fluid components and reactions in microfluidic systems
US11224876B2 (en) 2007-04-19 2022-01-18 Brandeis University Manipulation of fluids, fluid components and reactions in microfluidic systems
US11596908B2 (en) 2008-07-18 2023-03-07 Bio-Rad Laboratories, Inc. Droplet libraries
US11511242B2 (en) 2008-07-18 2022-11-29 Bio-Rad Laboratories, Inc. Droplet libraries
US11534727B2 (en) 2008-07-18 2022-12-27 Bio-Rad Laboratories, Inc. Droplet libraries
US9366632B2 (en) 2010-02-12 2016-06-14 Raindance Technologies, Inc. Digital analyte analysis
US10351905B2 (en) 2010-02-12 2019-07-16 Bio-Rad Laboratories, Inc. Digital analyte analysis
US10808279B2 (en) 2010-02-12 2020-10-20 Bio-Rad Laboratories, Inc. Digital analyte analysis
US9228229B2 (en) 2010-02-12 2016-01-05 Raindance Technologies, Inc. Digital analyte analysis
US11390917B2 (en) 2010-02-12 2022-07-19 Bio-Rad Laboratories, Inc. Digital analyte analysis
US11254968B2 (en) 2010-02-12 2022-02-22 Bio-Rad Laboratories, Inc. Digital analyte analysis
US11635427B2 (en) 2010-09-30 2023-04-25 Bio-Rad Laboratories, Inc. Sandwich assays in droplets
US11077415B2 (en) 2011-02-11 2021-08-03 Bio-Rad Laboratories, Inc. Methods for forming mixed droplets
US11168353B2 (en) 2011-02-18 2021-11-09 Bio-Rad Laboratories, Inc. Compositions and methods for molecular labeling
US11747327B2 (en) 2011-02-18 2023-09-05 Bio-Rad Laboratories, Inc. Compositions and methods for molecular labeling
US11768198B2 (en) 2011-02-18 2023-09-26 Bio-Rad Laboratories, Inc. Compositions and methods for molecular labeling
US11754499B2 (en) 2011-06-02 2023-09-12 Bio-Rad Laboratories, Inc. Enzyme quantification
US11898193B2 (en) 2011-07-20 2024-02-13 Bio-Rad Laboratories, Inc. Manipulating droplet size
US11901041B2 (en) 2013-10-04 2024-02-13 Bio-Rad Laboratories, Inc. Digital analysis of nucleic acid modification
US11174509B2 (en) 2013-12-12 2021-11-16 Bio-Rad Laboratories, Inc. Distinguishing rare variations in a nucleic acid sequence from a sample
US10647981B1 (en) 2015-09-08 2020-05-12 Bio-Rad Laboratories, Inc. Nucleic acid library generation methods and compositions
US20220189186A1 (en) * 2020-12-10 2022-06-16 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and non-transitory storage medium
US11941903B2 (en) * 2020-12-10 2024-03-26 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and non-transitory storage medium

Similar Documents

Publication Publication Date Title
JP2009265751A (ja) 文字認識装置、光学式文字認識システム及び文字認識プログラム
KR100625755B1 (ko) 문자 인식 장치, 문자 인식 방법, 매체 처리 방법 및 문자 인식 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체
JP6015189B2 (ja) 画像検査装置、画像形成装置、画像検査方法及び画像形成システム
KR100658119B1 (ko) 문자 인식 장치 및 방법
JP2002352191A (ja) 手書き判別能力を持つプリンティング制御インターフェースシステムとその方法
JP4821663B2 (ja) 文字ノイズ除去装置、文字ノイズ除去方法、文字ノイズ除去プログラム
TW200842734A (en) Image processing program and image processing device
US20210357674A1 (en) Image processing system, image processing method, and storage medium each for obtaining pixels of object using neural network
JPH0877339A (ja) 画像処理装置
US20130308862A1 (en) Image processing apparatus, image processing method, and computer readable medium
JP4881605B2 (ja) 文字認識装置、記憶媒体、文字認識方法
JP5337563B2 (ja) 帳票認識方法および装置
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
Leydier et al. Learning-free text-image alignment for medieval manuscripts
US20190057276A1 (en) Image analysis apparatus, image analysis method, and non-transitory computer readable medium
JP2010074342A (ja) 画像処理装置、画像形成装置、及びプログラム
JP5601027B2 (ja) 画像処理装置及び画像処理プログラム
JP4807618B2 (ja) 画像処理装置及び画像処理プログラム
JP2007041832A (ja) 差分画像抽出装置
US20180032809A1 (en) Information extraction device, image forming apparatus including information extraction device and method of controlling information extraction device
US9619901B2 (en) Image processing apparatus, image processing method, and non-transitory computer readable medium using an elimination color to determine color processing for a document image
JP4936250B2 (ja) 書込み抽出方法、書込み抽出装置および書込み抽出プログラム
JP3955467B2 (ja) 画像処理プログラム及び画像処理装置
JP5767549B2 (ja) 画像処理装置、画像処理方法、およびプログラム
Kleber et al. Document reconstruction by layout analysis of snippets

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101221

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110926

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111004

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120228