JP2015210674A - 画像処理装置、その制御方法、及びプログラム - Google Patents
画像処理装置、その制御方法、及びプログラム Download PDFInfo
- Publication number
- JP2015210674A JP2015210674A JP2014091934A JP2014091934A JP2015210674A JP 2015210674 A JP2015210674 A JP 2015210674A JP 2014091934 A JP2014091934 A JP 2014091934A JP 2014091934 A JP2014091934 A JP 2014091934A JP 2015210674 A JP2015210674 A JP 2015210674A
- Authority
- JP
- Japan
- Prior art keywords
- character
- contour
- characteristic shape
- pixel
- processing apparatus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
【課題】手書き文字を認識する際に、ボールペン特有のボテによる文字切れを好適に補間する仕組みを提供する。【解決手段】本画像処理装置は、原稿から読み取った画像から文字を検出し、検出された文字が手書き文字である場合に、当該文字の輪郭線の方向を検出し、検出された輪郭線に基づき、手書き文字がボールペンで書かれたことを示す特徴的形状が当該文字に含まれるか否かを判定し、特徴的形状が当該文字に含まれると判定されると、特徴的形状に相当する欠落補間領域を特定し、欠落補間領域の画素値を特徴的形状に対応する画素の画素値に変換する。【選択図】図4
Description
本発明は、手書き文字を補正する画像処理装置、その制御方法、及びプログラムに関するものである。
手書き文字が追記された文書をスキャナなどでスキャンし、OCR( Optical Character Recognition: 光学的文字認識)ソフトを用いて文字認識を行い、手書き文字の認識結果を含む文書の再構成に利用するといったニーズがある。しかし、手書きで記述した文字情報は、従来、マス目指定、数字のみ等の条件を厳しく制限しなければ、実用的な認識率が得られないのが現状である。
そこで、手書き文字の認識精度を向上させるための画像処理装置、又は文字認識装置が提案されている。特許文献1には、活字と手書き文字が混在した入力画像に対して、1文字単位の文字切り出し処理を行い、文字から特徴量を算出し、活字と手書き文字の分離を行い、それぞれに対応する文字認識処理を実行することで、手書き文字の認識率を高める技術が提案されている。特許文献2には、入力画像に対して、輪郭線方向を検出し、文字の黒画素の総量と輪郭の全長を計測し、文字の文字線幅を求め、さらに文字の線幅を一定にすることで文字の認識率を高める技術が提案されている。また、手書き文字には、文字のかすれによって、文字が切れてしまう場合があり、上述の特許文献1や特許文献2では、文字として認識できない場合がある。そこで、特許文献3では、文字の切れを修復し文字認識率を高める技術が提案されている。具体的には、認識できなかった文字領域に対して、縦横における複数の画素で構成されるマトリックスを縦、横、斜め方向に9分割し、文字画像の方向線分と文字切れを検出している。文字の切れを検出できたときは、方向成分を考慮し、文字の線分を補間している。
しかしながら、上記従来技術には以下に記載する問題がある。ボールペンを使って文字を書く場合、紙に転写しきれなかったインクが、図示しないボールペンのボールの保持部にたまり、大きくなったインクの固まりが紙に付着する、ボテと呼ばれる現象が発生することが知られている。このボテのために、ボールペンの筆跡は書き出し部分で、部分的に途切れていたり、細くなっている箇所がある。
図1(b)は、ボールペンで書いた文字を示す。図1(a)の「l」の拡大図である。図1(b)の101がボテであり、下方に筆跡が続くが、ボテ101の後で文字が一度途切れ、筆跡102と離れてしまっている。このような場合、文字認識において、アルファベットの「l」を「i」と誤認識することもある。
特許文献3の補間処理においては、マトリックス領域内の文字切れ部分をすべて補間してしまうために、本来補間しなくてもよい領域を補間してしまう。図1の例では、上記補間処理は問題ないが、実際に「i」の文字を「l」として誤認識する要因となる。
本発明は、上述の問題に鑑みて成されたものであり、手書き文字を認識する際に、ボールペン特有のボテによる文字切れを好適に補間する仕組みを提供することを目的とする。
本発明は、例えば、画像処理装置であって、原稿の画像を読み取る読取手段と、前記読取手段によって読み取られた画像から文字を検出する文字検出手段と、前記文字検出手段によって検出された文字が手書き文字である場合に、当該文字の輪郭線の方向を検出する輪郭線検出手段と、前記輪郭線検出手段によって検出された輪郭線に基づき、手書き文字がボールペンで書かれたことを示す特徴的形状が当該文字に含まれるか否かを判定する判定手段と、前記判定手段によって前記特徴的形状が当該文字に含まれると判定されると、前記特徴的形状に相当する欠落補間領域を特定する特定手段と、前記特定手段によって特定された欠落補間領域の画素値を前記特徴的形状に対応する画素の画素値に変換する補間手段とを備えることを特徴とする。
本発明によれば、手書き文字を認識する際に、ボールペン特有のボテによる文字切れを好適に補間する仕組みを提供できる。
以下に本発明の一実施形態を示す。以下で説明される個別の実施形態は、本発明の上位概念、中位概念及び下位概念など種々の概念を理解するために役立つであろう。また、本発明の技術的範囲は、特許請求の範囲によって確定されるのであって、以下の個別の実施形態によって限定されるわけではない。
<画像処理装置の構成>
まず、図2を参照して、本実施形態に係る画像処理装置200の構成について説明する。画像処理装置200は、各種演算処理を行うCPU201、基本プログラムを記憶するROM202及び各種情報を記憶するRAM203をバスライン212に接続した一般的なコンピュータシステムの構成となっている。バスライン212にはさらに、固定ディスク204、表示装置206、キーボード207、マウス208、及び読取装置209がインタフェース(I/F)211を介して接続される。固定ディスク204は、各種情報を記憶する。表示装置206は画像等の各種情報の表示を行う。キーボード207及びマウス208は、操作者からの入力を受け付ける。読取装置209は、原稿から画像を読み取る。また、不図示の他の装置(印刷装置等)との間で信号を送受信する通信部210を有する。本実施形態においては、読取装置209はスキャナなどの画像読取装置として説明するが、本実施形態により本発明が限定されるものではない。
まず、図2を参照して、本実施形態に係る画像処理装置200の構成について説明する。画像処理装置200は、各種演算処理を行うCPU201、基本プログラムを記憶するROM202及び各種情報を記憶するRAM203をバスライン212に接続した一般的なコンピュータシステムの構成となっている。バスライン212にはさらに、固定ディスク204、表示装置206、キーボード207、マウス208、及び読取装置209がインタフェース(I/F)211を介して接続される。固定ディスク204は、各種情報を記憶する。表示装置206は画像等の各種情報の表示を行う。キーボード207及びマウス208は、操作者からの入力を受け付ける。読取装置209は、原稿から画像を読み取る。また、不図示の他の装置(印刷装置等)との間で信号を送受信する通信部210を有する。本実施形態においては、読取装置209はスキャナなどの画像読取装置として説明するが、本実施形態により本発明が限定されるものではない。
画像処理装置200においては、プログラム205が固定ディスク204に記憶される。プログラム205がRAM203にコピーされるとともにCPU201がRAM203内のプログラムに従って演算処理を実行することにより(即ち、コンピュータがプログラムを実行することにより)、画像処理装置200が文字画像の文字の補間処理を行う。
<制御構成>
次に、図3を参照して、文字画像の文字の補間処理を行うプログラム300の構成について説明する。文字画像の文字の補間処理を行うプログラム300は、文字情報検出部310と、線幅検出部313と、欠落補間部320とを含む。また、文字情報検出部310は、手書き文字検出部311及びボールペン文字検出部312を含む。
次に、図3を参照して、文字画像の文字の補間処理を行うプログラム300の構成について説明する。文字画像の文字の補間処理を行うプログラム300は、文字情報検出部310と、線幅検出部313と、欠落補間部320とを含む。また、文字情報検出部310は、手書き文字検出部311及びボールペン文字検出部312を含む。
文字情報検出部310は、画像に含まれる文字情報を検出する。線幅検出部313は、文字の線幅を検出する。欠落補間部320は、文字情報検出部310が検出した文字の補間処理を行う。手書き文字検出部311は、手書き文字における所定のパラメータを検出する。ボールペン文字検出部312は、。手書き文字検出部311で検出された所定のパラメータから、ボールペンで書かれた文字であるか否かを検出する。
<補正処理>
次に、図4を参照して、文字の補正処理の処理手順について説明する。以下で説明する処理は、CPU201がRAM203に格納された制御プログラム、例えばプログラム300を実行することにより実現される。
次に、図4を参照して、文字の補正処理の処理手順について説明する。以下で説明する処理は、CPU201がRAM203に格納された制御プログラム、例えばプログラム300を実行することにより実現される。
S401において、文字情報検出部310は、読取装置209が読み取った画像の画像データを、インタフェース(I/F)211を介して受け取る。本実施形態において、読取装置209から受け取る画像データは、活字と手書き文字が混在して記載されている文書や帳票であるとして説明する。しかしながら、文字情報検出部310が受け取る画像データは、手書き文字のみでもよく、本実施形態により本発明が限定されるものではない。
続いて、S402において、文字情報検出部310は、読取装置209から受け取とった画像データに対して、2値化処理やノイズ除去、傾き補正などの処理を実行し、画像データから1文字ごとの文字データを抽出する。続いて、S403において、文字情報検出部310は、S402で抽出した文字データが活字文字であるか、又は手書き文字であるかを判定する。S402の1文字データ抽出に係る処理、及び、文字データが活字文字であるか又は手書き文字であるかの判定処理は公知の技術を用いる(例えば、特開平10−162102号公報)。S404で手書き文字と判定されるとS405に進み、そうでない場合は処理を終了する。
S405において、手書き文字検出部311は、輪郭線検出手段として機能し、手書き文字の輪郭線方向の検出処理を行う。輪郭線方向の検出は、S403において検出した手書き文字画像から、図5に示すような2画素×2画素(所定画素数)の複数のマトリックス領域を分割して切り出し、当該マトリックス領域に含まれる黒画素501を文字領域として検出し、白画素502を背景領域として検出する。当該マトリックス領域において、検出した文字領域と背景領域との位置から輪郭線方向を決定する。
具体的には、図5(a1)の2画素×2画素のマトリックスにおいて、黒画素501は、右上と右下に位置しており、下から上方向の輪郭線が存在するとみなし、当該マトリックスの右下の画素の輪郭線方向を上向きとする。また、図5(a2)の2画素×2画素のマトリックスにおいて、黒画素501は、左上と左下に位置しており、上から下方向の輪郭線が存在するとみなし、当該マトリックスの左上の画素の輪郭線方向を下向きとする。同様に、図5(b1)(b2)は右上がり左下がり、図5(c1)(c2)は右下がり左上がり、(d1)(d2)は左向き右向きの輪郭線方向を示すと判断する。
当該マトリックスでの判定は、手書き文字画像の左上から開始し、1画素ずつ右に移動しながら進める。当該マトリックスが手書き文字画像の右端に達したときは、1画素下にずらし再度、左端から判定処理を行う。当該マトリックスの判定処理を全領域に及ぶように移動し文字画像の全画素における輪郭線方向データを得る。
各画素の輪郭線方向データは、図11に示すように、注目画素を中心に、輪郭線を8方向に符号化した、1から8の数値が割り当てられる。例えば、図11に示すように、1は左上方向を示し、2は左方向、3は左下方向、4は下方向、5は右下方向、6は右方向、7は右上方向、8は上方向を示すように定義される。S405の輪郭線方向の検出によって、図6に示すようなチェイン符号化された輪郭線方向データ(輪郭線画像データ)が生成される。図6(b)は、図6(a)に示すアルファベットのiの各位置の輪郭線方向データを矢印で示している例である。即ち、文字画像は、文字の輪郭線に沿って、画素ごとに1から8の数値が割り当てられる。
図4の説明に戻る。S406において、ボールペン文字検出部312は、補間対象であるボールペンで書かれたボールペン文字を検出する。詳細な検出処理については後述する。S406において、ボールペン文字が検出された場合は、S407において、後述する補間対象部分の補間処理を行い、処理を終了する。補間処理の詳細については後述する。
<ボールペン文字の検出処理>
次に、図7、図8、図9及び図12を参照してボールペン文字の検出処理について説明する。上述したように、ボールペンは書き出し部分にボールペンで書かれたことを示す1つの判断材料となる特徴的形状、即ちボテ101が発生する可能性が高い。本実施形態によれば、この特徴的形状であるボテ101を探索し、ボテ101を検出した場合は、ボールペンで書かれた文字と判断する。
次に、図7、図8、図9及び図12を参照してボールペン文字の検出処理について説明する。上述したように、ボールペンは書き出し部分にボールペンで書かれたことを示す1つの判断材料となる特徴的形状、即ちボテ101が発生する可能性が高い。本実施形態によれば、この特徴的形状であるボテ101を探索し、ボテ101を検出した場合は、ボールペンで書かれた文字と判断する。
ボールペン検出部312の処理は、ボテ101の検出の前に、筆跡102の検出を行う。ボールペン文字の筆跡102部の探索にあたり、図8に示すような8画素×8画素からなるフィルタ800を用意する。当該フィルタ800は、左上を原点G(0,0)とし、各画素の位置をG(i,j)で表すとする。図8に示すフィルタ800内の数値が記入されたブロックは、画素の輪郭線方向データを表わしている。
図8に示すフィルタ800内で探索するボールペン文字の書き出し部に相当する輪郭線の形状として、図12に示すように8つのケースがある。ケース1は、ボールペン文字の書き出し部が左から右方向へ真っ直ぐに延びた輪郭線である。ケース2は、ボールペン文字の書き出し部が左から右上方向へ延びた輪郭線である。ケース3は、ボールペン文字の書き出し部が左から右下方向へ延びた輪郭線である。ケース4は、ボールペン文字の書き出し部が上から下方向へ真っ直ぐに延びた輪郭線である。ケース5は、ボールペン文字の書き出し部が下から上方向へ真っ直ぐに延びた輪郭線である。ケース6は、ボールペン文字の書き出し部が右から左方向へ真っ直ぐに延びた輪郭線である。ケース7は、ボールペン文字の書き出し部が右から左上方向へ延びた輪郭線である。ケース8は、ボールペン文字の書き出し部が右から左下方向へ延びた輪郭線である。また、図12の検索対象フラグは、後述するS701において探索対象とする輪郭線の形状を表わしており、値が1のとき、探索対象として有効になる。
通常、手書き文字の書き順は、左から右方向、又は上から下方向であることが多い。そのため、本実施形態では、探索する輪郭線の形状を、ケース1、ケース2、ケース3及びケース4としている。なお、探索する輪郭線の形状は、本実施形態に限定されるものではない。また、図12の検索対象フラグは、ユーザがキーボード207やマウス208を介して設定することができる。
以下では、図7を参照して、ボールペン文字の検出処理について説明する。以下で説明する処理は、CPU201がRAM203に格納された制御プログラム、例えばプログラム300を実行することにより実現される。
まず、S701において、ボールペン文字検出部312は、フィルタ800内に、図12のケース1に相当する輪郭線が存在するか探索を行う。具体的には、ボールペン文字検出部312は、図4のS405で取得した文字画像の輪郭線方向データから、フィルタ800の大きさの領域を切り出す。さらに、フィルタ800の右端(G(7,0)からG(7,7))の領域において、輪郭線方向データの値が2の画素(即ち左向きの輪郭線)が存在するか探索する。つまり、S701では、各ケースに対応する方向とは逆方向の輪郭線方向データを探索する。
尚、S701に関する処理は、ケース2の場合、当該フィルタ800の右端(G(7,0)からG(7,7))に、輪郭線方向データの値が3の画素(即ち左下向きの輪郭線)の存在を探索する。ケース3の場合は、当該フィルタ800の右端(G(7,0)からG(7,7))に、輪郭線方向データの値が1の画素(即ち、左上向きの輪郭線)の存在を探索する。ケース4の場合は、当該フィルタ800の下端(G(0,7)からG(7,7))に、輪郭線方向データの値が8の画素(即ち上向きの輪郭線)の存在を探索する。
S702において、輪郭線方向データが2である左向きの輪郭線の画素を検出できなかった場合は、S712に進み、検出できた場合はS703に進む。S712において、ボールペン文字検出部312は、図12に示す検索対象フラグで有効になっているケースをまだ探索していない場合は、S701に処理を戻す。一方、全てのケースを探索済みの場合は、S710に進み、ボールペン文字検出部312は、文字画像の輪郭線方向データから次の領域を切り出し、次の探索への処理を行うため、本フローチャートの処理を終了する。
S703において、ボールペン文字検出部312は、輪郭線方向データの示す画素を追跡する。尚、本実施形態において説明するS703からS711に至る処理は、ケース1に相当する輪郭線を用いるが、ケース2、ケース3及びケース4についても、同様の処理内容となる。
図8に示す例の場合、G(7,5)の画素の輪郭線方向データは2のため、G(6,5)に進み、同様にG(5,5)、G(4,5)と追跡する。輪郭線の追跡は、追跡先の画素が、当該フィルタ800の領域以外になるか、スタートの画素G(7,5)に戻るまで繰り返す。
その後、S704において、ボールペン文字検出部312は、輪郭線の追跡が終了したときの画素が、フィルタ800の右端(G(7,0)からG(7,7))のいずれかに位置し、輪郭線方向データの値が、6(右向き)であるか否かを判定する。即ち、図8の画素802が上記条件を満たすことになる。S705において、ボールペン文字検出部312は、書き出し領域である否かを判定する。具体的には、図8に示すように、画素802が条件を満たすため、追跡した輪郭線で囲まれた領域804が文字の書き出し部分の候補であると判断してS706に進む。一方、条件を満たさない場合はS710へ進む。
S706において、ボールペン文字検出部312は、図8に示す画素G(7,5)の輪郭線の直線成分の判定を行う。通常、手書き文字は筆跡癖などにより、文字の書き出し部分の直線の長さは、活字と比べて短くなる。そのため、直線成分は、G(7,5)の輪郭線方向データを追跡し、3画素以上同じ左向きの輪郭線方向データが並んでいるかを判定条件とする。図8に示す例の場合、G(7,5)とG(6,5)、G(5,5)の3画素が対象になる。
同様に、図8に示す画素G(7,2)の輪郭線の直線成分の判定を行う。直線成分は、G(7,2)の輪郭線方向データを逆に追跡し、3画素以上同じ右向きの輪郭線方向データが並んでいるかを判定条件とする。図8に示す例の場合、G(7,2)とG(6,2)、G(5,2)の3画素が対象になる。
S707において、ボールペン文字検出部312は、左向きの輪郭線方向データが3画素並び、かつ、右向きの輪郭線方向データが3画素並んでいるときは、S708に進み、そうでない場合はS710に進む。S708において、ボールペン文字検出部312は、線幅を算出する。具体的には、G(7,2)とG(7,5)の間の画素数を文字の線幅803とする。図8の場合、線幅803は4となる。
次に、S709において、ボールペン文字検出部312は、フィルタ800の延長上の領域(所定画素だけ延長した範囲内)、即ち図9のフィルタ900において閉じた領域の探索を行う。つまり、当該フィルタG(0,0)とG(7,0)、G(7,7)、G(0,7)に囲まれた領域の左隣のG(−8,0)と、G(−1,0)、G(−1,7)、G(−8,7)に囲まれた領域を含めたフィルタ900に閉じた輪郭線903の有無を調べる。つまり、ここでは、書き出し部分の近傍におけるボテの有無を調べる。
まず、図9の画素801のG(7,5)から画素802のG(7,2)に至る輪郭線方向データを順々に追跡していき、最も左に位置する画素、即ち座標iが小さい画素、G(3,4)を基準画素901と定める。最も左に位置する画素が複数存在する場合は、最初に見つかった画素を基準画素とする。
次に、フィルタ900の基準画素901の左隣の画素G(2,4)からG(−8,4)方向へ、輪郭線方向データを有している画素を探索していき、初めに輪郭線方向データを検出した画素(図9では画素902)で探索を終了する。探索最大画素数(所定画素数)Lは、線幅803の2倍の画素数(図9では8画素となる)とする。探索最大画素数L以内で、輪郭線方向データを有している画素を発見できないときは、閉じた輪郭線方向データが存在しないと判断する。探索最大画素数Lの値は、実験等により予め相応しい値が設定されているが、筆記角度や筆圧、紙質などによってばらつきがあるため、本実施形態に限定されるものではなく、筆記角度や筆圧、紙質などの補正情報を加味して決定してもよい。図9の場合、G(−1,4)の画素902に輪郭線方向データが存在するので、G(−1,4)の位置で探索を終了する。
次に、画素902を開始位置とし、画素902が有する輪郭線方向データを基に、輪郭線方向データを追跡していく。図9の場合、G(−1,4)、G(−2,5)、G(−3,5)、G(−4,5)の順で追跡していく。輪郭線の追跡は、追跡先の画素が開始位置の画素902に戻るまで繰り返す。ただし、追跡する輪郭線が閉じていない場合もありえるので、最大追跡画素数Nを超えない範囲で追跡する。最大追跡画素数Nの値は、実験等により予め相応しい値が設定されている。輪郭線の追跡が開始位置の画素902で終了した場合は、閉じた輪郭線903が存在すると判断する。ここで、画素902は、特徴的形状(ボテ)の一部の画素となる。
次に、閉じた輪郭線903の面積が所定の画素数以下であるかを、下記条件式を使って判断する。
閉じた輪郭線903の領域の画素数<(線幅803/2)x(線幅803/2)xπx2・・・式1
式1において、閉じた輪郭線903の面積が、線幅803から計算できる面積の2倍より小さい値になるように設定しているが、これは、ボテ101の大きさが、上記条件式1を満たす場合が多いためである。しかしながら、ボテ101は、筆記角度や筆圧、紙質などによってばらつきがあるため、本実施形態に限定されるものではなく、筆記角度や筆圧、紙質などの補正情報を加味して決定してもよい。
閉じた輪郭線903の領域の画素数<(線幅803/2)x(線幅803/2)xπx2・・・式1
式1において、閉じた輪郭線903の面積が、線幅803から計算できる面積の2倍より小さい値になるように設定しているが、これは、ボテ101の大きさが、上記条件式1を満たす場合が多いためである。しかしながら、ボテ101は、筆記角度や筆圧、紙質などによってばらつきがあるため、本実施形態に限定されるものではなく、筆記角度や筆圧、紙質などの補正情報を加味して決定してもよい。
S711において、ボールペン文字検出部312は、閉じた輪郭線903が上記条件式1を満たしている場合、ボールペンの手書き特有の領域画像と判断し、処理を終了する。一方、そうでないと判断すると処理をS710に進める。
<補間処理>
次に、図10を参照して、図4のS407における欠落部分の補間処理について説明する。上記S711で位置と大きさが所定の条件内である閉じた輪郭線903を特定すると以下の補間処理を行う。
次に、図10を参照して、図4のS407における欠落部分の補間処理について説明する。上記S711で位置と大きさが所定の条件内である閉じた輪郭線903を特定すると以下の補間処理を行う。
閉じた輪郭線903の画素の中で、最も左に位置する画素、即ち座標iが小さい画素1001の座標G(−5,4)を基に補間する領域を特定する。具体的には、図10の座標801のG(7,5)と座標802のG(7,2)、座標1003のG(−5,2)、座標1002のG(−5,5)の領域を欠落補間領域1004として特定する。欠落補間部320は、欠落補間領域1004を特定すると、当該欠落補間領域1004の背景画素、即ち、当該領域内の全ての画素値を、閉じた輪郭線903の画素値に変換して画像データの補間処理を行う。
以上説明したように、本実施形態によれば、ボールペンで文字を書いたときに、ボールペンのインクのボテによる文字の欠けた箇所を補間し、手書き文字の文字認識率を高めることができる。また、文字認識前に文字の欠けた場所を補間できるために、誤認識後に、再度、文字認識処理をする必要がなくなるため、処理時間を短縮できる。
本発明は、上記実施形態に限らず様々な変形が可能である。上記実施形態では、文字画像の輪郭線抽出を行うために、文字画像の線幅を3から5画素程度として説明しているが、線幅は2画素以上であればよい。また、本実施形態では、2画素×2画素のマトリックス領域で、8方向の輪郭方向データを求めたが、マトリックスのサイズを大きくし、8方向以上の輪郭方向データを算出してもよい。
<その他の実施形態>
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)がプログラムを読み出して実行する処理である。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)がプログラムを読み出して実行する処理である。
Claims (9)
- 画像処理装置であって、
原稿の画像を読み取る読取手段と、
前記読取手段によって読み取られた画像から文字を検出する文字検出手段と、
前記文字検出手段によって検出された文字が手書き文字である場合に、当該文字の輪郭線の方向を検出する輪郭線検出手段と、
前記輪郭線検出手段によって検出された輪郭線に基づき、手書き文字がボールペンで書かれたことを示す特徴的形状が当該文字に含まれるか否かを判定する判定手段と、
前記判定手段によって前記特徴的形状が当該文字に含まれると判定されると、前記特徴的形状に相当する欠落補間領域を特定する特定手段と、
前記特定手段によって特定された欠落補間領域の画素値を前記特徴的形状に対応する画素の画素値に変換する補間手段と
を備えることを特徴とする画像処理装置。 - 前記輪郭線検出手段は、
前記文字検出手段によって検出された文字を所定画素数の複数の領域に分割し、当該領域ごとに、文字を構成する画素の位置に従って輪郭線の方向を検出し、文字の輪郭を示すチェイン符号化された輪郭線画像データを生成することを特徴とする請求項1に記載の画像処理装置。 - 前記判定手段は、
前記輪郭線画像データが表す文字において、前記検出された輪郭線を所定の画素から当該画素の輪郭線の方向に従って追跡することによって、前記文字の書き出し部分を特定し、特定した書き出し部分の近傍に前記特徴的形状が存在するか否かを判定することを特徴とする請求項2に記載の画像処理装置。 - 前記判定手段は、
前記書き出し部分を構成する複数の輪郭線のいずれかの方向を所定画素数だけ延長した範囲内に前記特徴的形状の一部が存在するか否かを判定することを特徴とする請求項3に記載の画像処理装置。 - 前記所定画素数とは前記輪郭線画像データが表す文字の線幅に基づいて決定されることを特徴とする請求項4に記載の画像処理装置。
- 前記判定手段は、さらに、所定の大きさである前記特徴的形状のみを該特徴的形状として判定することを特徴とする請求項5に記載の画像処理装置。
- 前記特定手段は、前記書き出し部分と、前記特徴的形状との間を欠落部分と特定することを特徴とする請求項3乃至6の何れか1項に記載の画像処理装置。
- 画像処理装置の制御方法であって、
原稿の画像を読み取る読取工程と、
前記読取工程において読み取られた画像から文字を検出する文字検出工程と、
前記文字検出工程において検出された文字が手書き文字である場合に、当該文字の輪郭線の方向を検出する輪郭線検出工程と、
前記輪郭線検出工程において検出された輪郭線に基づき、手書き文字がボールペンで書かれたことを示す特徴的形状が当該文字に含まれるか否かを判定する判定工程と、
前記判定工程において前記特徴的形状が当該文字に含まれると判定されると、前記特徴的形状に相当する欠落補間領域を特定する特定工程と、
前記特定工程において特定された欠落補間領域の画素値を前記特徴的形状に対応する画素の画素値に変換する補間工程と
を実行することを特徴とする画像処理装置の制御方法。 - 請求項1乃至7の何れか1項の画像処理装置としてコンピュータを機能させるための該コンピュータで読み取り可能なプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014091934A JP2015210674A (ja) | 2014-04-25 | 2014-04-25 | 画像処理装置、その制御方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014091934A JP2015210674A (ja) | 2014-04-25 | 2014-04-25 | 画像処理装置、その制御方法、及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2015210674A true JP2015210674A (ja) | 2015-11-24 |
Family
ID=54612806
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014091934A Pending JP2015210674A (ja) | 2014-04-25 | 2014-04-25 | 画像処理装置、その制御方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2015210674A (ja) |
-
2014
- 2014-04-25 JP JP2014091934A patent/JP2015210674A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5729930B2 (ja) | 文書内のテキスト行を区分するための方法 | |
US8452133B2 (en) | Underline removal apparatus | |
US9104940B2 (en) | Line segmentation method applicable to document images containing handwriting and printed text characters or skewed text lines | |
AU2012203130B2 (en) | Image processing apparatus, method, and program | |
US9678642B2 (en) | Methods of content-based image area selection | |
JP4393411B2 (ja) | 画像処理装置、画像処理プログラムおよび画像処理方法 | |
US8600175B2 (en) | Apparatus and method of processing image including character string | |
JP4011646B2 (ja) | 行検出方法および文字認識装置 | |
US10984277B2 (en) | Image analysis apparatus, image analysis method, and non-transitory computer readable medium | |
US9418281B2 (en) | Segmentation of overwritten online handwriting input | |
JP2008011135A (ja) | 画像処理装置および画像処理プログラム | |
US10430963B2 (en) | Image processing apparatus, image reading apparatus, and non-transitory computer readable medium storing program | |
JP2015210674A (ja) | 画像処理装置、その制御方法、及びプログラム | |
JP4208520B2 (ja) | 画像処理装置および画像処理方法、プログラムおよび記憶媒体 | |
JP6700705B2 (ja) | 振り分けシステム、情報処理方法、及びプログラム | |
JP4117648B2 (ja) | 帳票、帳票処理方法、帳票処理プログラム、帳票処理プログラムを記録した記録媒体及び帳票処理装置 | |
US9111141B2 (en) | Image processing apparatus, non-transitory computer readable medium storing program, and image processing method | |
JP5630098B2 (ja) | 情報処理装置およびプログラム | |
JP4974367B2 (ja) | 領域分割方法及び装置、並びにプログラム | |
JP5361315B2 (ja) | 情報処理装置及び情報処理方法 | |
JP5867045B2 (ja) | 画像処理装置及びプログラム | |
JP2720588B2 (ja) | 文字認識装置 | |
JP2006277509A (ja) | ドットテクスチャ重畳表記部形状回復方法及びそのためのプログラム | |
JP2021099688A (ja) | 画像処理装置、画像処理方法、およびプログラム | |
Mandal et al. | Slant Estimation and Correction for Online Handwritten Bengali Words |