JP2011065643A - 文字認識方法及び文字認識装置 - Google Patents
文字認識方法及び文字認識装置 Download PDFInfo
- Publication number
- JP2011065643A JP2011065643A JP2010200193A JP2010200193A JP2011065643A JP 2011065643 A JP2011065643 A JP 2011065643A JP 2010200193 A JP2010200193 A JP 2010200193A JP 2010200193 A JP2010200193 A JP 2010200193A JP 2011065643 A JP2011065643 A JP 2011065643A
- Authority
- JP
- Japan
- Prior art keywords
- mark
- character
- pixels
- pixel
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
【課題】開示技術は文字認識方法及び文字認識装置を提供すること。
【解決手段】開示技術の実施例に係る文字認識方法は、認識対象である文字画像におけるマークが付加された文字上のマークの位置及び形状の特徴に基づいて、マークの一部であるマーク画素を抽出し、マーク画素と同一の方向を有する隣り合う画素を含めることによって、抽出したマークの一部であるマーク画素をマーク線分に拡張し、認識対象である文字画像の細線化画像を取得し、細線化画像の軌跡に沿って、拡張したマーク線分をマークに成長させ、成長させたマークを文字画像から分離し、分離した文字画像を認識する。
【選択図】図2
【解決手段】開示技術の実施例に係る文字認識方法は、認識対象である文字画像におけるマークが付加された文字上のマークの位置及び形状の特徴に基づいて、マークの一部であるマーク画素を抽出し、マーク画素と同一の方向を有する隣り合う画素を含めることによって、抽出したマークの一部であるマーク画素をマーク線分に拡張し、認識対象である文字画像の細線化画像を取得し、細線化画像の軌跡に沿って、拡張したマーク線分をマークに成長させ、成長させたマークを文字画像から分離し、分離した文字画像を認識する。
【選択図】図2
Description
本発明は、文字認識方法及び文字認識装置に関する。より具体的には、本発明は、文字画像におけるマークが分離できる文字認識方法及び文字認識装置に関する。
近年、OCR(Optical Character Recognition:光学式文字認識)システムが普及してきており、それを応用するアプリケーションにとっても、さらに重要なものとなってきている。OCRシステムは、紙文書を電子ファイルに変換して、データの入力を簡易化させると共に、大量の文書の編集、管理、配付等を行えるようにする。OCRシステムの認識能力は、結果を利用するアプリケーションでの処理に影響を与える重要な要素であり、精度の高い認識能力が求められる。一般的な文書ファイル、特に定型文書に対しては、既存のOCRシステムの多くは、何れも高い認識率を実現する。
しかしながら、例えば、受付票、調査票、手形等の場合には、文字に何かのマークを付けることで選択肢の選択結果を示すことがあり、このような文字に付けられたマークは、OCRシステムでの文字認識を困難なものにする。まず、一部のマークは、二つ又は更に多くの文字を連結させて一つの文字を形成する。この結果、OCRシステムは、文字の分割処理を失敗する。また、文字領域より広い領域を占めるマークの場合、OCRシステムが行う文字サイズの正規化の際に、文字のサイズが小さくなる。この結果、OCRシステムは文字認識に失敗してしまう。
このため、既存の技術では、OCRシステムは、色彩で分類する方法によって、文字と異なる色のマーク画素を抽出する。また、既に開示された他の方法では、マークと文字との階調差に基づいて、マークと文字とを分離させて認識する。
しかしながら上述した従来の技術では、認識対象である文字画像におけるマークが付加された文字上のマークを簡単に検出して分離することができないという課題があった。
具体的には、色彩で分類する方法は、マークが文字と同じ色である場合、OCRシステムは、正常にマークと文字とを分離させることができない。また、マークと文字との階調差に基づいてマークと文字とを分離させて認識する方法は、マークと文字とが同一の階調を有する場合がよくあるので、OCRシステムは、正常にマークと文字とを分離させることができない。したがって、これらの方法では一般的な帳票などに対しては、高い認識率を実現できるとは言い難い。
開示技術は上記の課題に鑑みてなされたものであって、文字上にマークがあっても、空間位置及び形状の特徴に基づいて、マークと文字とを分離させて、文字を認識する文字認識方法及び文字認識装置を提供することを目的とする。
以下にまず、開示技術に関する概略を与えることにより、開示技術のある側面に対する基本的な理解を提供する。理解すべきは、この概略は開示技術を十分に説明するものではない。また、開示技術のキーポイント又は重要な部分を限定するものでもなく、開示技術の範囲を限定するものでもない。ただ、簡単な形態で概念を与えることで、後述する更に詳しい説明の前置部分とする。
開示技術の一つの側面によると、文字認識装置が、認識対象である文字画像におけるマークが付加された文字上のマークの位置及び形状の特徴に基づいて、マークの一部であるマーク画素を抽出するステップと、マーク画素と同一の方向を有する隣り合う画素を含めることによって、抽出したマークの一部であるマーク画素をマーク線分に拡張するステップと、認識対象である文字画像の細線化画像を取得するステップと、細線化画像の軌跡に沿って、拡張したマーク線分をマークに成長させるステップと、成長させたマークを文字画像から分離するステップと、分離した文字画像を認識するステップを含む文字認識方法を提供する。
開示技術の一実施例に係る文字認識方法は、さらに、認識対象である文字画像中のマークが付加された文字候補領域をマークが付加された文字に特定するステップを含む。
開示技術の他の形態によると、認識対象である文字画像におけるマークが付加された文字上のマークの位置及び形状の特徴に基づいて、マークの一部であるマーク画素を抽出するように配置されたマーク画素抽出部と、マーク画素と同一の方向を有する隣り合う画素を含めることによって、抽出した一部のマーク画素をマーク線分に拡張するように配置された拡張部と、認識対象である文字画像の細線化画像を取得するように配置された細線化画像取得部と、細線化画像の軌跡に沿って、拡張したマーク線分をマークに成長させるように配置されたマーク線分成長部と、成長させたマークを文字画像から分離するように配置された分離部と、マークを分離した文字画像を認識するように配置された認識部とを有することを特徴とする文字認識装置を提供する。
開示技術の一実施例に係る文字認識装置は、さらに、認識対象である文字画像中のマークが付加された文字候補領域をマークが付加された文字に特定するように配置されたマーク文字特定部を含む。
候補領域をマークが付加された文字に特定するステップは、認識対象である文字画像のテキストブロックを水平方向と垂直方向へ交互に投影することによって、テキストブロックを候補領域に分割するステップと、分割した候補領域のサイズを比較することによって、分割した候補領域を、接触領域と、大きいサイズの領域と、正常サイズの領域とに分類するステップと、接触領域と大きいサイズの領域をマークが付加された文字とするステップを含むことが好ましい。
開示技術の一実施例によると、マークの一部であるマーク画素を抽出するステップは、水平方向へ投影したヒストグラムの両端の山と、垂直方向へ投影したヒストグラムの両端の山をそれぞれ分離させることによって、一組の候補マーク画素を特定するステップと、最小二乗法のカーブフィッティング方法により楕円曲線モデルを利用することによって、一組の候補マーク画素を楕円曲線にフィッティングするステップと、一組の候補マーク画素のフィッティング誤差を算出することによって、一組の候補マーク画素がマーク画素であるか否かを判定するステップを含む。
開示技術の他の一実施例によると、マークの一部であるマーク画素を抽出するステップは、ランレングスを解析することによって、文字画像のマークの線幅を推測するステップと、接触方向に直交する方向に沿って、接触断片の走査時の特徴を検出するステップと、スキャンラインにおいて二つの部分を有して各部分の幅がマークの線幅に相当する走査時の特徴を備えた線分における画素をマーク画素として判定するステップを含む。
開示技術の更なる他の一実施例によると、マークの一部であるマーク画素を抽出するステップは、各マークが付加された文字に対して、マークが付加された文字と同行又は同列に位置する文字である参照文字を特定するステップと、参照文字に基づいて、基準座標を算出するステップと、基準座標の範囲外にある画素をマーク画素として抽出するステップを含む。また、参照文字が水平方向に並んでいる場合、参照文字の縦方向の座標値のみを基準座標の算出に用いるステップと、参照文字が垂直方向に並んでいる場合、参照文字の横方向の座標値のみを基準座標の算出に用いることが好ましい。
開示技術の一実施例によると、抽出したマークの一部であるマーク画素を拡張するステップは、マークが付加された文字中の画素に対して4方向への傾斜度を算出することによって、マークが付加された文字中の画素の方向パターンを取得するステップと、方向パターンの局所領域に含まれた同一の値を有する画素を含めることによって、特定したマーク画素を拡張するステップを含む。
開示技術の一実施例によると、拡張したマーク線分を成長させるステップは、接合点にいたるまで、細線化画像の軌跡中の隣接画素を逐一に含めるステップを含む。
開示技術に係る文字認識方法及び文字認識装置によると、文字上にマークがあっても、空間位置及び形状の特徴を利用することにより、マークと文字とを簡単に分離する。よって、開示技術に係る文字認識方法及び文字認識装置は、文字画像を回復させて、文字画像を認識することに利用できる。
また、開示技術は、文字認識方法を実現するためのコンピュータプログラムを提供する。
そして、開示技術は、文字認識方法を実現するためのコンピュータプログラムコードが記録されている少なくともコンピュータで読取可能な形態の媒体として、コンピュータプログラム製品を提供する。
本願の開示する文字認識方法及び文字認識装置によれば、認識対象である文字画像におけるマークが付加された文字上のマークを簡単に検出して分離することができるという効果がある。よって本願の開示する文字認識方法及び文字認識装置を用いれば、文字画像を回復させて、文字画像を認識することに利用できる。
以下、図面を参照して開示技術の実施例を説明する。説明を明確で簡潔にするために、実施形態の特徴のすべてを明細書に記載しているわけではない。しかし、このようないかなる実施例を実用化する場合、開発者は、実施形態を特定できる。例えば、開発者は、システム及び業務に関連する制約条件に実施形態を適合させる。また、開発者は、実施形態に応じてこれらの制約条件を変更できる。また、実用化には複雑で時間が必要であるが、開示技術からアイデアを得た当業者にとっては、これらは実用化に伴う義務に過ぎない。
なお、すべての図面において、同一又は類似の符号で同一又は類似の部品を表示する。図面は、下記の詳細な説明とともに本明細書に含まれ且つ本明細書の一部になる。より多くの例を挙げて開示技術の最適な実施例を説明することで、開示技術の動作と効果を一層理解することができる。
また、図面中の構成要素は、説明を簡潔かつ明確にするために示されているだけであり、必ずしも実際の縮尺に基づいて示されているわけではない。例えば、開示技術の実施例を理解しやすくするために、図面中のある構成要素の大きさは、その他の構成要素よりも拡大されている場合がある。
また、開示技術が不明確になることを防ぐため、図面において、開示技術と直接関係する装置の構造及び/又は処理ステップのみを示し、開示技術と直接関係しない他のものについては、詳細な説明を省略している。
開示技術を一層理解するため、以下、図1に示す例を用いて、文字認識装置が文字画像におけるマークが付加された文字上のマークを文字画像から分離して文字画像を認識し、文字を得る動作を説明する。図1Aは、認識対象である文字画像の例を示す図である。図1Bは、開示技術の実施例に係る図1Aに示す文字画像におけるマークが付加された文字上のマークを文字画像から分離させた後に出力する文字画像を示す図である。図1Cは、開示技術の実施例に係る図1Aに示す文字画像におけるマークが付加された文字上のマークを文字画像から分離させた後に出力するマークを示す図である。
以下、まず図2〜図14を参照して、開示技術の実施例に係る文字認識方法の基本的な動作を説明する。
図2に示すように、開示技術の実施例に係る文字認識方法において、文字認識装置は、マークが付加された文字の特定ステップS210と、マークの一部であるマーク画素抽出ステップS220と、抽出マーク画素拡張ステップS230と、細線化画像取得ステップS240と、拡張マーク線分成長ステップS250と、文字マーク分離ステップS260と、分離後文字認識ステップS270とを実行する。マークが付加された文字の特定ステップS210は、認識対象である文字画像の候補領域をマークが付加された文字に特定する。マークの一部であるマーク画素抽出ステップS220は、認識対象である文字画像におけるマークが付加された文字上のマークの位置及び形状の特徴に基づいて、マークの一部であるマーク画素を抽出する。抽出マーク画素拡張ステップS230は、同一の方向を有する隣り合う画素を含めることによって、抽出したマークの一部であるマーク画素をマーク線分に拡張する。細線化画像取得ステップS240は、認識対象である文字画像の細線化画像(thinned image)を取得する。拡張マーク線分成長ステップS250は、細線化画像の軌跡に沿って、拡張したマーク線分をマークに成長させる。文字マーク分離ステップS260は、拡張マーク線分成長ステップS250で成長させたマークを文字画像から分離させる。分離後文字認識ステップS270は、マークが分離された文字画像を認識する。
ここで、説明しておきたいことは、マークが付加された文字の特定ステップS210は、選択可能なステップである。つまり、文字認識装置は、マークが付加された文字を特定せずに、認識対象である文字画像に対してマークの一部であるマーク画素抽出ステップS220及びその後の処理を実行することができる。この場合でも、文字認識装置は、マークと文字画像とを分離させて、分離後の文字画像を認識することができ、認識の精度及び信頼性を向上させることが実現できる。
続いて、図3〜図14を参照して、図2に示す文字認識方法に含まれるマークが付加された文字特定ステップS210と、マークの一部であるマーク画素抽出ステップS220と、抽出マーク画素拡張ステップS230と、細線化画像取得ステップS240と、拡張マーク線分成長ステップS250と、文字マーク分離ステップS260と、分離後文字認識ステップS270等の各ステップにおける処理を詳しく説明する。
図3は、開示技術の実施例に係る図2に示す候補領域をマークが付加された文字に特定するステップの処理手順を示すフローチャートである。図3に示すように、文字認識装置は、マーク付きの文字を特定する場合、先ず、ステップS310において、認識対象である文字画像におけるテキストブロックを水平方向と垂直方向へ交互に投影することによって、テキストブロックを候補領域に分割する。
続いて、文字認識装置は、ステップS320において、ステップS310にて分割した候補領域のサイズを比較することによって、分割した候補領域を、接触領域と、大きいサイズの領域と、正常サイズの領域との三種類に分類する。図4は、開示技術の実施例に係る分割及び分類する処理を実行した後の文字画像の例を示した図である。最後に、文字認識装置は、ステップS330において、接触領域と大きいサイズの領域とをマークが付加された文字として特定し、正常サイズの領域をマークが付加されていない文字として特定する。
ここで、文字認識装置は、マークが付加された文字と同行又は同列に位置する文字である参照文字をマークが付加された文字毎に特定する。図4に示すように、文字認識装置は、表示された大きいサイズの領域に対しては、二つの参照文字を特定したが、接触領域に対しては、一つの参照文字のみを特定する。
一方、文字認識装置は、全ての文字が正常サイズの領域であると、認識対象である文字画像をマークが付加されていない文字に分類する。よって、処理手順は図2に示すマークの一部であるマーク画素抽出ステップS220と、抽出マーク画素拡張ステップS230と、細線化画像取得ステップS240と、拡張マーク線分成長ステップS250と、文字マーク分離ステップS260とを実行せずに、分離後文字認識ステップS270を実行する。
図3に示す手順に従ってマークが付加された文字を特定した後、文字認識装置は、特定したマークが付加された文字の位置及び形状の特徴に基づいて、マークの一部であるマーク画素を抽出する。文字認識装置は、マークの一部であるマーク画素を抽出する場合、マークの異なる位置及び形状の特徴に応じて対応する処理を行うことができる。以下、幾つかの具体的状況について具体的に分析して説明する。
開示技術の一実施例によると、文字認識装置は、マークの一部であるマーク画素を抽出する場合、図5A及び図5Bに示すように、文字を含む矩形枠の外にあるマークの一部であるマーク画素を抽出する。図5Aに示すように、文字認識装置は、この特徴に基づいて、マークが文字の周りを緊密に取り囲む場合、マークの一部であるマーク画素を簡単に抽出する。また、文字認識装置は、図5Bに示すように、利用できる参照文字がない接触状態の場合、このような処理形態でも良好な処理効果を得ることができる。
図6は、開示技術の実施例に係る図2に示すマークの一部であるマーク画素抽出ステップS220の第1例の処理手順を示すフローチャートである。図6に示すように、文字認識装置は、先ず、ステップS610において、水平方向へ投影したヒストグラムの両端の山と、垂直方向へ投影したヒストグラムの両端の山をそれぞれ分離させることによって、一組の候補マーク画素を特定する。
図7Aは、垂直方向へ投影する文字画像の例を示す図である。図7Bは、文字画像を垂直方向へ投影したヒストグラムの例を示す図である。図7Bにおける左右両側にある二つの縦線は、図7Aにおける文字の両側にある二つの縦線に対応する。図7Cは、水平方向へ投影する文字画像の例を示す図である。図7Dは、文字画像を水平方向へ投影したヒストグラムの例を示す図である。図7Dにおける左右両側の二つの縦線は、図7Cにおける文字の両側にある二つの横線に対応する。
したがって、図7A〜図7Dに示す例の場合、文字認識装置は、図7Aにおける二つの縦線の外にあるピクセル(それぞれ図7Bにおける左右両側の縦線の外にある二つの波形に対応する)をマーク画素として抽出する。また、文字認識装置は、図7Cにおける二つの横線の外にあるピクセル(それぞれ図7Dにおける左右両側の縦線の外にある二つの波形に対応する)をマーク画素として抽出する。
その後、文字認識装置は、ステップS620において、最小二乗法のカーブフィッティング方法によって楕円曲線を利用して一組の候補マーク画素をフィッティングする。そして、文字認識装置は、ステップS630において、一組の候補マーク画素のフィッティング誤差を算出して、一組の候補マーク画素がマーク画素であるか否かを判定する。文字認識装置は、フィッティング誤差が小さいと、この一組の候補マーク画素における画素がマーク画素であると判定する。文字認識装置は、ステップS620とステップS630の処理を経て、実際は文字画素であるが、誤ってマーク画素であると判定された画素を排除することができる。例えば、文字認識装置は、図7Aにおける右側の縦直線外にある画素に対して、実際の画素値とフィッティングされた楕円曲線とのフィッティング誤差が所定の閾値を超えているので、これをマーク画素ではないと判定する。
また、文字認識装置は、マークの一部であるマーク画素を抽出する際、接触状態に対して、接触断片の走査時の特徴によって、マーク画素を抽出することもできる。図8は、開示技術の実施例に係る図2に示すマークの一部であるマーク画素抽出ステップS220の第2例の処理手順を示すフローチャートである。
図8に示すように、この実施例によるマークの一部であるマーク画素の抽出処理は、先ず、ステップS810において、ランレングス(run-length)を解析することによって、マークの線幅を推測し、その後、ステップS820において、接触方向に直交する方向に沿って、接触断片の走査時の特徴を検出し、ステップS830において、スキャンラインにおいて二つの部分を有して各部分の幅がマークの線幅に相当する走査時の特徴を備えた線分における画素をマーク画素として抽出する。
図9は、開示技術の実施例に係る走査時の特徴を利用してマークの一部であるマーク画素を抽出した例を示す図である。図9に示すマークにおける階調が深い部分が、スキャンライン上の幅がマークの線幅に相当する二つの部分であるので、文字認識装置は、これらの画素をマーク画素として抽出する。
また、文字認識装置は、大きいサイズの状態について、マークの一部であるマーク画素を抽出する際、参照文字のレイアウトを分析することによって、マーク画素を抽出することができる。図10は、開示技術の実施例に係る図2に示すマークの一部であるマーク画素抽出ステップS220の第3例の処理手順を示すフローチャートである。
図10に示すように、文字認識装置は、マークの一部であるマーク画素を抽出する場合、先ず、ステップS1010において、各マークが付加された文字に対して、マークが付加された文字と同行又は同列に位置する文字である参照文字を特定する。その後、文字認識装置は、ステップS1020において、参照文字に基づいて基準座標を算出する。文字認識装置は、文字の基準座標を算出した後、ステップS1030において、基準座標の範囲外にある画素をマーク画素として抽出する。
ステップS1020において基準座標を算出する場合、文字認識装置は、参照文字が水平方向に並んでいれば、参照文字の縦方向の座標値のみを基準座標の算出に用いる。同様に、文字認識装置は、参照文字が垂直方向に並んでいれば、参照文字の横方向の座標値のみを基準座標の算出に用いる。
図11は、開示技術の実施例に係る基準座標を参照して、マークの一部であるマーク画素を抽出した別例を示す図である。図11に示すように、文字認識装置は、文字画像における二つの縦線の点線の外にある画素をマーク画素として抽出する。
上述した方法によってマークの一部であるマーク画素を抽出した後、文字認識装置は、図2に示す抽出マーク画素拡張ステップS230において、同一の方向を有する隣り合う画素を含めることによって、抽出したマークの一部であるマーク画素をマーク線分に拡張する。図12は、開示技術の実施例に係る図2に示す抽出したマーク画素をマーク線分に拡張するステップの処理手順を示すフローチャートである。
図12に示すように、文字認識装置は、抽出したマークの一部であるマーク画素を拡張する場合、先ず、ステップS1210において、マークが付加された文字中の画素に対して4方向への傾斜度を算出することによって、マークが付加された文字中の画素の方向パターンを取得した後、ステップS1220において、方向パターンの局所領域に含まれた同一の値を有する画素を含めることによって、先に特定したマーク画素を拡張する。
図13は、局所領域でのマークの傾斜度を求めるパターンを示す図である。図13に示すように、文字認識装置は、以下の式によって、画素毎の各方向における傾斜度を算出することによって、マークが付加された文字中の画素の方向パターンを取得する。
C_horizontal=|in(i,j)-in(i,j-1)|+|in(i,j)-in(i,j+1)|+|in(i-1,j)-in(i-1,j-1)|+|in(i-1,j)-in(i-1,j+1)|+|in(i+1,j)-in(i+1,j-1)|+|in(i+1,j)-in(i+1,j+1)|
C_vertical=|in(i,j)-in(i-1,j)|+|in(i,j)-in(i+1,j)|+|in(i,j-1)-in(i-1,j-1)|+|in(i,j-1)-in(i+1,j-1)|+|in(i,j+1)-in(i-1,j+1)|+|in(i,j+1)-in(i+1,j+1)|
C_diagonal135=|in(i,j)-in(i-1,j-1)|+|in(i,j)-in(i+1,j+1)|+2*|in(i,j+1)-in(i-1,j)|+2*|in(i,j-1)-in(i+1,j)|
C_diagonal45=|in(i,j)-in(i-1,j+1)|+|in(i,j)-in(i+1,j-1)|+2*|in(i,j-1)-in(i-1,j)|+2*|in(i,j+1)-in(i+1,j)|
C_horizontal=|in(i,j)-in(i,j-1)|+|in(i,j)-in(i,j+1)|+|in(i-1,j)-in(i-1,j-1)|+|in(i-1,j)-in(i-1,j+1)|+|in(i+1,j)-in(i+1,j-1)|+|in(i+1,j)-in(i+1,j+1)|
C_vertical=|in(i,j)-in(i-1,j)|+|in(i,j)-in(i+1,j)|+|in(i,j-1)-in(i-1,j-1)|+|in(i,j-1)-in(i+1,j-1)|+|in(i,j+1)-in(i-1,j+1)|+|in(i,j+1)-in(i+1,j+1)|
C_diagonal135=|in(i,j)-in(i-1,j-1)|+|in(i,j)-in(i+1,j+1)|+2*|in(i,j+1)-in(i-1,j)|+2*|in(i,j-1)-in(i+1,j)|
C_diagonal45=|in(i,j)-in(i-1,j+1)|+|in(i,j)-in(i+1,j-1)|+2*|in(i,j-1)-in(i-1,j)|+2*|in(i,j+1)-in(i+1,j)|
文字認識装置は、先に特定したマーク画素の拡張を行う場合、方向パターンで特定したマーク線分が重なっているならば、このマーク線分全体をマーク画素として特定し、これによって、抽出したマークの一部であるマーク画素を拡張する。
図2に戻り、文字認識装置は、ステップS230にて抽出したマークの一部であるマーク画素を拡張した後、ステップS240において、認識対象である文字画像の細線化画像を取得する。図14は、細線化後の認識対象である文字画像の例を示す図である。
続いて、文字認識装置は、ステップS250において、接合点にいたるまで、細線化された画像の軌跡に含まれた画素を逐一に含めることによって、ステップS230にて拡張されたマーク線分をマークに成長させる。その後、文字認識装置は、ステップS260において、成長させたマークを文字画像から分離させ、ステップS270において、マークを分離した文字画像を認識する。
以上、図2〜図14を参照して、開示技術の実施例に係る文字認識方法の処理手順及びその詳細な動作を説明した。以下、図15を参照して、開示技術の実施例に係る文字認識装置の構造及びその動作を説明する。図15は、開示技術の実施例に係る文字認識装置の構成を示すブロック図である。
図15に示すように、この実施例に係る文字認識装置は、マーク文字特定部1510と、マーク画素抽出部1520と、拡張部1530と、細線化画像取得部1540と、マーク線分成長部1550と、分離部1560と、認識部1570とを備える。マーク文字特定部1510は、認識対象である文字画像の候補領域をマークが付加された文字として特定するように配置される。マーク画素抽出部1520は、認識対象である文字画像のマークの位置及び形状の特徴に基づいてマークの一部であるマーク画素を抽出するように配置される。拡張部1530は、同一の方向を有する隣り合う画素を含めることによって、抽出したマークの一部であるマーク画素をマーク線分に拡張するように配置される。細線化画像取得部1540は、認識対象である文字画像の細線化画像を取得するように配置される。マーク線分成長部1550は、細線化画像の軌跡に沿って、拡張したマーク線分をマークに成長させるように配置される。分離部1560は、成長させたマークを文字画像から分離するように配置される。認識部1570は、マークを分離した文字画像を認識するように配置される。
この実施例による文字認識装置に含まれるマーク文字特定部1510と、マーク画素抽出部1520と、拡張部1530と、細線化画像取得部1540と、マーク線分成長部1550と、分離部1560と、認識部1570等の各ブロックにおける具体的な処理手順は、それぞれ図2〜図14を参照して説明した文字認識方法におけるマークが付加された文字の特定ステップS210と、マークの一部であるマーク画素抽出ステップS220と、抽出マーク画素拡張ステップS230と、細線化画像取得ステップS240、拡張マーク線分成長ステップS250と、文字マーク分離ステップS260と、分離後文字認識ステップS270等の各ステップにおける処理に対応するので、詳しい説明を省略する。
同様に、指摘しておきたいことは、ここでのマーク文字特定部1510は選択的に配置することのできるもので、開示技術の一実施例によって、マーク文字特定部1510を含まず、マーク画素抽出部1520と、拡張部1530と、細線化画像取得部1540と、マーク線分成長部1550と、分離部1560と、認識部1570とからなることによってもよい。この場合も同様に、文字認識装置は、文字画像からマークを分離させることができ、認識の精度を向上させることが実現できる。
このように、開示技術の実施例に係る文字認識方法及び文字認識装置によると、認識対象である文字画像におけるマークが付加された文字上のマークを正確に検出することができ、文字画像から全て又はマークの一部であるマーク画素を分離させて、正確に文字を認識することができる。
その他、開示技術の実施例に係る文字認識方法及び文字認識装置によると、安定で信頼性の高いマーク位置及び形状の特徴を用いて、文字画像におけるマークを分離する。また、位置及び形状の特徴は、文字にも適用するので、抽出した画素がマーク画素であることを保証でき、正確に文字画像から全て又はマークの一部であるマーク画素を抽出できる。この結果、開示技術の実施例に係る文字認識方法及び文字認識装置は、文字画像を高精度に認識できる。
その他、開示技術の実施例に係る文字認識方法及び文字認識装置によると、方向パターン及び細線化された画像の軌跡を参照してマーク線分を拡張する。したがって、空間上の制限を提供し、文字画像をマーク画像として間違って分割することを防止する。この結果、開示技術の実施例に係る文字認識方法及び文字認識装置は、文字画像とマーク画像とを正確に分離して、引き続く処理で文字画像を高精度に認識できる。
以上、具体的な実施例を通して、開示技術の基本動作を説明した。開示技術の方法及び装置の全て、又はいかなるステップや構成部品は、いかなる計算装置(プロセッサ、記憶媒体等を含む)又は計算装置のネットワークにおいて、ハードウェア、ファームウェア、ソフトウェア又はそれらを組合せることによって実現できる。なお、これは、当業者であれば、開示技術に記載の説明を読めば、基本的なプログラミング技術によって実現できるものである。
開示技術は、いかなる計算装置であっても、一つのプログラム又は1組のプログラムによって、実現できる。この計算装置は一般的なコンピュータであってもよい。すなわち、開示技術は、方法又は装置が実現できるプログラムコードを含むプログラム製品を提供することによって、実現することもできる。したがって、このようなプログラム製品も開示技術に属し、このようなプログラム製品を記憶している記憶媒体も開示技術に属する。なお、記憶媒体は、いかなる周知の記憶媒体であってもよく、また、将来に開発される全ての記憶媒体であってもよいことは言うまでもない。
ソフトウェア及び/又はファームウェアによって開示技術の実施例を実行する場合、記憶媒体又はネットワークから、各種類の機能等を実行する。例えば図16に示す専用のハードウェア構造を有するコンピュータ700は、ソフトウェアを構成するプログラムを装着された場合、各種類の機能等を実行することができる。
図16は、開示技術に係る文字認識方法を実行する情報処理機器の構造を示すブロック図である。図16に示す、中央演算処理装置(CPU)701は、読取専用記憶装置(ROM)702に記憶されているプログラム又は記憶部708からランダムアクセスメモリ(RAM)703にロードしたプログラムに従って各処理を実行する。RAM703は、CPU701によって実行される各処理等のデータを必要に応じて記憶する。CPU701、ROM702、RAM703は、バス704を介して互いに接続される。入力/出力インターフェース705もバス704に接続される。
出力部707と、記憶部708と、通信部709は、入力/出力インターフェース705に接続される。入力部706は、キーボード、マウス等を含む。出力部707は、ブラウン管(CRT)と液晶ディスプレイ(LCD)等のディスプレイとスピーカー等を含む。記憶部708は、ハードディスク等を含む。通信部709は、LANカード等のネットワークインターフェースカードと変復調装置等を含む。また、通信部709は、インターネット等のネットワークを介して通信処理を行う。
ドライバ710は、必要に応じて、入力/出力インターフェース705に接続される。着脱可能な媒体711は、必要に応じてドライバ710に接続される。したがって、着脱可能な媒体711の中から読取られるコンピュータプログラムは、必要に応じて記憶部708に格納される。なお、着脱可能な媒体711は、例えば、磁気ディスク、光ディスク、光磁気ディスク、半導体メモリ等の記憶媒体である。
ソフトウェアを介して一連の処理を実行する場合、コンピュータ700は、インターネット等のネットワーク又は着脱可能な媒体711等から、ソフトウェアを構成するプログラムを読み取る。
図16に示す記憶媒体は、プログラムを記憶すると共に、装置と分離して設置することによって、ユーザにプログラムを提供する。例えば、記憶媒体は、ROM702、記憶部708に含まれたハードディスク等であってもよい。そして、これらの中にはプログラムが記憶され、ハードディスク等と共にユーザに提供される。すなわち、プログラムを提供するのは、着脱可能な媒体711に限定されない。なお、着脱可能な媒体711には、例えば、磁気ディスク(フロッピー(登録商標)ディスクを含む)と、光ディスク(光ディスクROM(CD−ROM)とデジタル・バーサタイル・ディスク(DVD)を含む)と、光磁気ディスク(ミニディスク(MD)(登録商標))と、半導体メモリと、が含まれる。
また、開示技術の装置及び方法において、各構成部又は各ステップは分離する、及び/又は新たに組み合わせることができることは明らかである。このような分離及び/又は新たな組合せは、開示技術と同等の実施形態であると見なされるべきである。また、一連の処理を実行するステップは、説明した順序及び時間順に従って実行されるが、必ずしも説明した順序及び時間順に実行されることに限定されない。例えば、一部のステップは並行して実行されてもよく、また、互いに独立して実行されてもよい。
上述のように開示技術の動作及び効果を詳細に説明した。開示技術は、特許請求の範囲を逸脱しなければ、各種の変更、入換え、変換を行ってもよい。そして、本願における「含む」、「備える」又は同義の他の表現形態は、非排他性の含みをカバーする。すなわち、一連の要素を含む手順、方法、物又は装置は、これらの要素を含む以外にも明確に記載していない他の要素も含む。あるいは、このような手順、方法、物又は装置の固有の要素も含む。さらに、限定していない場合、「…を含む」によって限定される要素は、この要素を含む手順、方法、物又は装置に他の同様な要素が含まれていることを否定しない。
以上の各実施例を含む実施形態に関し、さらに以下の付記を開示する。
(付記1)文字認識装置が、
認識対象である文字画像におけるマークが付加された文字上のマークの位置及び形状の特徴に基づいて、前記マークの一部であるマーク画素を抽出するステップと、
前記マーク画素と同一の方向を有する隣り合う画素を含めることによって、前記抽出したマークの一部であるマーク画素をマーク線分に拡張するステップと、
前記認識対象である文字画像の細線化画像を取得するステップと、
前記細線化画像の軌跡に沿って、前記拡張したマーク線分をマークに成長させるステップと、
前記成長させたマークを前記文字画像から分離するステップと、
前記分離した文字画像を認識するステップを含む文字認識方法。
認識対象である文字画像におけるマークが付加された文字上のマークの位置及び形状の特徴に基づいて、前記マークの一部であるマーク画素を抽出するステップと、
前記マーク画素と同一の方向を有する隣り合う画素を含めることによって、前記抽出したマークの一部であるマーク画素をマーク線分に拡張するステップと、
前記認識対象である文字画像の細線化画像を取得するステップと、
前記細線化画像の軌跡に沿って、前記拡張したマーク線分をマークに成長させるステップと、
前記成長させたマークを前記文字画像から分離するステップと、
前記分離した文字画像を認識するステップを含む文字認識方法。
(付記2)文字認識装置が、
前記認識対象である文字画像のマークが付加された文字候補領域を前記マークが付加された文字に特定するステップを更に含む付記1に記載の文字認識方法。
前記認識対象である文字画像のマークが付加された文字候補領域を前記マークが付加された文字に特定するステップを更に含む付記1に記載の文字認識方法。
(付記3)前記候補領域をマークが付加された文字に特定するステップは、
前記認識対象である文字画像のテキストブロックを水平方向と垂直方向へ交互に投影することによって、前記テキストブロックを候補領域に分割するステップと、
前記分割した候補領域のサイズを比較することによって、前記分割した候補領域を、接触領域と、大きいサイズの領域と、正常サイズの領域とに分類するステップと、
前記接触領域と前記大きいサイズの領域を前記マークが付加された文字とするステップを含む付記2に記載の文字認識方法。
前記認識対象である文字画像のテキストブロックを水平方向と垂直方向へ交互に投影することによって、前記テキストブロックを候補領域に分割するステップと、
前記分割した候補領域のサイズを比較することによって、前記分割した候補領域を、接触領域と、大きいサイズの領域と、正常サイズの領域とに分類するステップと、
前記接触領域と前記大きいサイズの領域を前記マークが付加された文字とするステップを含む付記2に記載の文字認識方法。
(付記4)前記マークの一部であるマーク画素を抽出するステップは、文字を含む矩形枠の外にあるマークの一部であるマーク画素を抽出するステップを含む付記3に記載の文字認識方法。
(付記5)前記マークの一部であるマーク画素を抽出するステップは、
水平方向へ投影したヒストグラムの両端の山と、垂直方向へ投影したヒストグラムの両端の山をそれぞれ分離させることによって、一組の候補マーク画素を特定するステップと、
最小二乗法のカーブフィッティング方法により楕円曲線モデルを利用することによって、前記一組の候補マーク画素を楕円曲線にフィッティングするステップと、
前記一組の候補マーク画素のフィッティング誤差を算出することによって、前記一組の候補マーク画素が前記マーク画素であるか否かを判定するステップを含む付記4に記載の文字認識方法。
水平方向へ投影したヒストグラムの両端の山と、垂直方向へ投影したヒストグラムの両端の山をそれぞれ分離させることによって、一組の候補マーク画素を特定するステップと、
最小二乗法のカーブフィッティング方法により楕円曲線モデルを利用することによって、前記一組の候補マーク画素を楕円曲線にフィッティングするステップと、
前記一組の候補マーク画素のフィッティング誤差を算出することによって、前記一組の候補マーク画素が前記マーク画素であるか否かを判定するステップを含む付記4に記載の文字認識方法。
(付記6)前記マークの一部であるマーク画素を抽出するステップは、
ランレングスを解析することによって、マークの線幅を推測するステップと、
接触方向に直交する方向に沿って、接触断片の走査時の特徴を検出するステップと、
スキャンラインにおいて二つの部分を有して各部分の幅が前記マークの線幅に相当する走査時の特徴を備えた線分における画素をマーク画素として判定するステップを含む付記3に記載の文字認識方法。
ランレングスを解析することによって、マークの線幅を推測するステップと、
接触方向に直交する方向に沿って、接触断片の走査時の特徴を検出するステップと、
スキャンラインにおいて二つの部分を有して各部分の幅が前記マークの線幅に相当する走査時の特徴を備えた線分における画素をマーク画素として判定するステップを含む付記3に記載の文字認識方法。
(付記7)前記マークの一部であるマーク画素を抽出するステップは、
各マークが付加された文字に対して、前記マークが付加された文字と同行又は同列に位置する文字である参照文字を特定するステップと、
前記参照文字に基づいて、基準座標を算出するステップと、
前記基準座標の範囲外にある画素を前記マーク画素として抽出するステップを含む付記3に記載の文字認識方法。
各マークが付加された文字に対して、前記マークが付加された文字と同行又は同列に位置する文字である参照文字を特定するステップと、
前記参照文字に基づいて、基準座標を算出するステップと、
前記基準座標の範囲外にある画素を前記マーク画素として抽出するステップを含む付記3に記載の文字認識方法。
(付記8)文字認識装置が、
前記参照文字が水平方向に並んでいる場合、前記参照文字の縦方向の座標値のみを前記基準座標の算出に用いるステップと、
前記参照文字が垂直方向に並んでいる場合、前記参照文字の横方向の座標値のみを前記基準座標の算出に用いる付記7に記載の文字認識方法。
前記参照文字が水平方向に並んでいる場合、前記参照文字の縦方向の座標値のみを前記基準座標の算出に用いるステップと、
前記参照文字が垂直方向に並んでいる場合、前記参照文字の横方向の座標値のみを前記基準座標の算出に用いる付記7に記載の文字認識方法。
(付記9)前記抽出したマークの一部であるマーク画素を拡張するステップは、
前記マークが付加された文字中の画素に対して4方向への傾斜度を算出することによって、前記マークが付加された文字中の画素の方向パターンを取得するステップと、
前記方向パターンの局所領域に含まれた同一の値を有する画素を含めることによって、前記特定したマーク画素を拡張するステップを含む付記1乃至8の中の何れかに記載の文字認識方法。
前記マークが付加された文字中の画素に対して4方向への傾斜度を算出することによって、前記マークが付加された文字中の画素の方向パターンを取得するステップと、
前記方向パターンの局所領域に含まれた同一の値を有する画素を含めることによって、前記特定したマーク画素を拡張するステップを含む付記1乃至8の中の何れかに記載の文字認識方法。
(付記10)前記拡張したマーク線分を成長させるステップは、
接合点にいたるまで、前記細線化画像の軌跡中の隣接画素を逐一に含めるステップを含む付記1乃至8の中の何れかに記載の文字認識方法。
接合点にいたるまで、前記細線化画像の軌跡中の隣接画素を逐一に含めるステップを含む付記1乃至8の中の何れかに記載の文字認識方法。
(付記11)認識対象である文字画像におけるマークが付加された文字上のマークの位置及び形状の特徴に基づいて、前記マークの一部であるマーク画素を抽出するように配置されたマーク画素抽出部と、
前記マーク画素と同一の方向を有する隣り合う画素を含めることによって、前記抽出した一部のマーク画素をマーク線分に拡張するように配置された拡張部と、
前記認識対象である文字画像の細線化画像を取得するように配置された細線化画像取得部と、
前記細線化画像の軌跡に沿って、前記拡張したマーク線分をマークに成長させるように配置されたマーク線分成長部と、
前記成長させたマークを前記文字画像から分離するように配置された分離部と、
前記マークを分離した文字画像を認識するように配置された認識部と
を有することを特徴とする文字認識装置。
前記マーク画素と同一の方向を有する隣り合う画素を含めることによって、前記抽出した一部のマーク画素をマーク線分に拡張するように配置された拡張部と、
前記認識対象である文字画像の細線化画像を取得するように配置された細線化画像取得部と、
前記細線化画像の軌跡に沿って、前記拡張したマーク線分をマークに成長させるように配置されたマーク線分成長部と、
前記成長させたマークを前記文字画像から分離するように配置された分離部と、
前記マークを分離した文字画像を認識するように配置された認識部と
を有することを特徴とする文字認識装置。
(付記12)前記認識対象である文字画像のマークが付加された文字候補領域を前記マークが付加された文字に特定するように配置されたマーク文字特定部を更に含む付記11に記載の文字認識装置。
(付記13)前記マーク文字特定部は、さらに、
前記認識対象である文字画像のテキストブロックを水平方向と垂直方向へ交互に投影することによって、前記テキストブロックを候補領域に分割し、
前記分割した候補領域のサイズを比較することによって、前記分割した候補領域を接触領域と、大きいサイズの領域と、正常サイズの領域とに分類し、
前記接触領域と前記大きいサイズの領域を前記マークが付加された文字とするように配置された付記12に記載の文字認識装置。
前記認識対象である文字画像のテキストブロックを水平方向と垂直方向へ交互に投影することによって、前記テキストブロックを候補領域に分割し、
前記分割した候補領域のサイズを比較することによって、前記分割した候補領域を接触領域と、大きいサイズの領域と、正常サイズの領域とに分類し、
前記接触領域と前記大きいサイズの領域を前記マークが付加された文字とするように配置された付記12に記載の文字認識装置。
(付記14)前記マーク画素抽出部は、さらに、文字を含む矩形枠の外にあるマークの一部であるマーク画素を抽出するように配置された付記13に記載の文字認識装置。
(付記15)前記マーク画素抽出部は、さらに、
水平方向へ投影したヒストグラムの両端の山と、垂直方向へ投影したヒストグラムの両端の山とをそれぞれ分離させることによって、一組の候補マーク画素を特定し、
最小二乗法のカーブフィッティング方法により楕円曲線モデルを利用することによって、前記一組の候補マーク画素を楕円曲線にフィッティングし、
前記一組の候補マーク画素のフィッティング誤差を算出して前記一組の候補マーク画素が前記マーク画素であるか否かを判定するように配置された付記14に記載の文字認識装置。
水平方向へ投影したヒストグラムの両端の山と、垂直方向へ投影したヒストグラムの両端の山とをそれぞれ分離させることによって、一組の候補マーク画素を特定し、
最小二乗法のカーブフィッティング方法により楕円曲線モデルを利用することによって、前記一組の候補マーク画素を楕円曲線にフィッティングし、
前記一組の候補マーク画素のフィッティング誤差を算出して前記一組の候補マーク画素が前記マーク画素であるか否かを判定するように配置された付記14に記載の文字認識装置。
(付記16)前記マーク画素抽出部は、さらに、
ランレングスを解析することによって、前記文字画像のマークの線幅を推測し、
接触方向に直交する方向に沿って、接触断片の走査時の特徴を検出し、
スキャンラインにおいて二つの部分を有して各部分の幅が前記マークの線幅に相当する走査時の特徴を備えた線分における画素をマーク画素として判定するように配置された付記13に記載の文字認識装置。
ランレングスを解析することによって、前記文字画像のマークの線幅を推測し、
接触方向に直交する方向に沿って、接触断片の走査時の特徴を検出し、
スキャンラインにおいて二つの部分を有して各部分の幅が前記マークの線幅に相当する走査時の特徴を備えた線分における画素をマーク画素として判定するように配置された付記13に記載の文字認識装置。
(付記17)前記マーク画素抽出部は、さらに、
各マークが付加された文字に対して、前記マークが付加された文字と同行又は同列に位置する文字である参照文字を特定し、
前記参照文字に基づいて、基準座標を算出し、
前記基準座標の範囲外にある画素を前記マーク画素として抽出するように配置された付記13に記載の文字認識装置。
各マークが付加された文字に対して、前記マークが付加された文字と同行又は同列に位置する文字である参照文字を特定し、
前記参照文字に基づいて、基準座標を算出し、
前記基準座標の範囲外にある画素を前記マーク画素として抽出するように配置された付記13に記載の文字認識装置。
(付記18)前記参照文字が水平方向に並んでいる場合、前記参照文字の縦方向の座標値のみを前記基準座標の算出に用い、
前記参照文字が垂直方向に並んでいる場合、前記参照文字の横方向の座標値のみを前記基準座標の算出に用いる付記17に記載の文字認識装置。
前記参照文字が垂直方向に並んでいる場合、前記参照文字の横方向の座標値のみを前記基準座標の算出に用いる付記17に記載の文字認識装置。
(付記19)前記拡張部は、さらに、
前記マークが付加された文字中の画素に対して4方向への傾斜度を算出することによって、前記マークが付加された文字中の画素の方向パターンを取得し、
前記方向パターンの局所領域に含まれた同一の値を有する画素を含めることによって、前記特定したマーク画素を拡張するように配置された付記11乃至18の中の何れかに記載の文字認識装置。
前記マークが付加された文字中の画素に対して4方向への傾斜度を算出することによって、前記マークが付加された文字中の画素の方向パターンを取得し、
前記方向パターンの局所領域に含まれた同一の値を有する画素を含めることによって、前記特定したマーク画素を拡張するように配置された付記11乃至18の中の何れかに記載の文字認識装置。
(付記20)前記マーク線分成長部は、さらに、
接合点に至るまで、前記細線化画像の軌跡中の隣接画素を逐一に含めるように配置された付記11乃至18の中の何れかに記載の文字認識装置。
接合点に至るまで、前記細線化画像の軌跡中の隣接画素を逐一に含めるように配置された付記11乃至18の中の何れかに記載の文字認識装置。
700 コンピュータ
701 中央演算処理装置(CPU)
702 読取専用記憶装置(ROM)
703 ランダムアクセスメモリ(RAM)
704 バス
705 入力/出力インターフェース
706 入力部
707 出力部
708 記憶部
709 通信部
710 ドライバ
711 着脱可能な媒体
1510 マーク文字特定部
1520 マーク画素抽出部
1530 拡張部
1540 細線化画像取得部
1550 マーク線分成長部
1560 分離部
1570 認識部
701 中央演算処理装置(CPU)
702 読取専用記憶装置(ROM)
703 ランダムアクセスメモリ(RAM)
704 バス
705 入力/出力インターフェース
706 入力部
707 出力部
708 記憶部
709 通信部
710 ドライバ
711 着脱可能な媒体
1510 マーク文字特定部
1520 マーク画素抽出部
1530 拡張部
1540 細線化画像取得部
1550 マーク線分成長部
1560 分離部
1570 認識部
Claims (10)
- 文字認識装置が、
認識対象である文字画像におけるマークが付加された文字上のマークの位置及び形状の特徴に基づいて、前記マークの一部であるマーク画素を抽出するステップと、
前記マーク画素と同一の方向を有する隣り合う画素を含めることによって、前記抽出したマークの一部であるマーク画素をマーク線分に拡張するステップと、
前記認識対象である文字画像の細線化画像を取得するステップと、
前記細線化画像の軌跡に沿って、前記拡張したマーク線分をマークに成長させるステップと、
前記成長させたマークを前記文字画像から分離するステップと、
前記分離した文字画像を認識するステップを含む文字認識方法。 - 文字認識装置が、
前記認識対象である文字画像のマークが付加された文字候補領域を前記マークが付加された文字に特定するステップを更に含む請求項1に記載の文字認識方法。 - 前記候補領域をマークが付加された文字に特定するステップは、
前記認識対象である文字画像のテキストブロックを水平方向と垂直方向へ交互に投影することによって、前記テキストブロックを候補領域に分割するステップと、
前記分割した候補領域のサイズを比較することによって、前記分割した候補領域を、接触領域と、大きいサイズの領域と、正常サイズの領域とに分類するステップと、
前記接触領域と前記大きいサイズの領域を前記マークが付加された文字とするステップを含む請求項2に記載の文字認識方法。 - 前記マークの一部であるマーク画素を抽出するステップは、
水平方向へ投影したヒストグラムの両端の山と、垂直方向へ投影したヒストグラムの両端の山をそれぞれ分離させることによって、一組の候補マーク画素を特定するステップと、
最小二乗法のカーブフィッティング方法により楕円曲線モデルを利用することによって、前記一組の候補マーク画素を楕円曲線にフィッティングするステップと、
前記一組の候補マーク画素のフィッティング誤差を算出することによって、前記一組の候補マーク画素が前記マーク画素であるか否かを判定するステップを含む請求項3に記載の文字認識方法。 - 前記マークの一部であるマーク画素を抽出するステップは、
ランレングスを解析することによって、マークの線幅を推測するステップと、
接触方向に直交する方向に沿って、接触断片の走査時の特徴を検出するステップと、
スキャンラインにおいて二つの部分を有して各部分の幅が前記マークの線幅に相当する走査時の特徴を備えた線分における画素をマーク画素として判定するステップを含む請求項3に記載の文字認識方法。 - 前記マークの一部であるマーク画素を抽出するステップは、
各マークが付加された文字に対して、前記マークが付加された文字と同行又は同列に位置する文字である参照文字を特定するステップと、
前記参照文字に基づいて、基準座標を算出するステップと、
前記基準座標の範囲外にある画素を前記マーク画素として抽出するステップを含む請求項3に記載の文字認識方法。 - 前記抽出したマークの一部であるマーク画素を拡張するステップは、
前記マークが付加された文字中の画素に対して4方向への傾斜度を算出することによって、前記マークが付加された文字中の画素の方向パターンを取得するステップと、
前記方向パターンの局所領域に含まれた同一の値を有する画素を含めることによって、前記特定したマーク画素を拡張するステップを含む請求項1乃至6の中の何れかに記載の文字認識方法。 - 前記拡張したマーク線分を成長させるステップは、
接合点にいたるまで、前記細線化画像の軌跡中の隣接画素を逐一に含めるステップを含む請求項1乃至6の中の何れかに記載の文字認識方法。 - 認識対象である文字画像におけるマークが付加された文字上のマークの位置及び形状の特徴に基づいて、前記マークの一部であるマーク画素を抽出するように配置されたマーク画素抽出部と、
前記マーク画素と同一の方向を有する隣り合う画素を含めることによって、前記抽出した一部のマーク画素をマーク線分に拡張するように配置された拡張部と、
前記認識対象である文字画像の細線化画像を取得するように配置された細線化画像取得部と、
前記細線化画像の軌跡に沿って、前記拡張したマーク線分をマークに成長させるように配置されたマーク線分成長部と、
前記成長させたマークを前記文字画像から分離するように配置された分離部と、
前記マークを分離した文字画像を認識するように配置された認識部と
を有することを特徴とする文字認識装置。 - 前記認識対象である文字画像のマークが付加された文字候補領域を前記マークが付加された文字に特定するように配置されたマーク文字特定部を更に含む請求項9に記載の文字認識装置。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200910173692 CN102024138B (zh) | 2009-09-15 | 2009-09-15 | 字符识别方法和字符识别装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011065643A true JP2011065643A (ja) | 2011-03-31 |
Family
ID=43865419
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010200193A Withdrawn JP2011065643A (ja) | 2009-09-15 | 2010-09-07 | 文字認識方法及び文字認識装置 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2011065643A (ja) |
CN (1) | CN102024138B (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102184396A (zh) * | 2011-06-13 | 2011-09-14 | 北方工业大学 | 基于ocr识别反馈的文档图像倾斜校正方法 |
CN102867178B (zh) * | 2011-07-05 | 2015-06-10 | 富士通株式会社 | 汉字识别方法和装置 |
CN102567725A (zh) * | 2011-12-23 | 2012-07-11 | 国网电力科学研究院 | 一种金融ocr系统手写体数字串的软切分方法 |
JP6089401B2 (ja) * | 2012-01-06 | 2017-03-08 | 富士ゼロックス株式会社 | 画像処理装置、指定印推定装置、及びプログラム |
CN104021385B (zh) * | 2013-03-02 | 2017-11-21 | 北京信息科技大学 | 基于模板匹配及曲线拟合的视频字幕细化方法 |
US9087272B2 (en) | 2013-07-17 | 2015-07-21 | International Business Machines Corporation | Optical match character classification |
CN106845473B (zh) * | 2015-12-03 | 2020-06-02 | 富士通株式会社 | 用于确定图像是否为带地址信息的图像的方法和装置 |
CN109542285A (zh) * | 2018-11-16 | 2019-03-29 | 北京小米移动软件有限公司 | 图像处理方法及装置 |
DE102019211984A1 (de) * | 2019-08-09 | 2021-02-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung, Verfahren zum Steuern derselben und Vorrichtungsverbund bzw. Schwarm |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1025764C (zh) * | 1992-05-12 | 1994-08-24 | 浙江大学 | 字符识别方法 |
US6047251A (en) * | 1997-09-15 | 2000-04-04 | Caere Corporation | Automatic language identification system for multilingual optical character recognition |
US7024042B2 (en) * | 2000-10-04 | 2006-04-04 | Fujitsu Limited | Word recognition device, word recognition method, and storage medium |
-
2009
- 2009-09-15 CN CN 200910173692 patent/CN102024138B/zh not_active Expired - Fee Related
-
2010
- 2010-09-07 JP JP2010200193A patent/JP2011065643A/ja not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
CN102024138B (zh) | 2013-01-23 |
CN102024138A (zh) | 2011-04-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2011065643A (ja) | 文字認識方法及び文字認識装置 | |
CN109543501B (zh) | 图像处理装置、图像处理方法和存储介质 | |
CN105868758B (zh) | 图像中文本区域检测方法、装置及电子设备 | |
JP3308032B2 (ja) | スキュー補正方法およびスキュー角検出方法およびスキュー補正装置およびスキュー角検出装置 | |
EP2669847B1 (en) | Document processing apparatus, document processing method and scanner | |
JP6569500B2 (ja) | 画像処理装置及び画像処理方法 | |
US10169673B2 (en) | Region-of-interest detection apparatus, region-of-interest detection method, and recording medium | |
JPS61267177A (ja) | 文書画像追加情報の蓄積方法 | |
JP2004139484A (ja) | 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム | |
JP2014153820A (ja) | 文字切り出し装置及び文字切り出し方法 | |
US9280725B2 (en) | Information processing apparatus, information processing method, and non-transitory computer readable medium | |
CN102779276B (zh) | 文本图像识别方法和装置 | |
JP2009123206A (ja) | 画像からテキストを抽出する方法及び装置 | |
US20130050765A1 (en) | Method and apparatus for document authentication using image comparison on a block-by-block basis | |
US8787676B2 (en) | Image processing apparatus, computer readable medium storing program, and image processing method | |
JP5027201B2 (ja) | テロップ文字領域検出方法,テロップ文字領域検出装置およびテロップ文字領域検出プログラム | |
US20180189562A1 (en) | Character recognition apparatus, character recognition method, and computer program product | |
KR102102394B1 (ko) | 문자 인식을 위한 영상 전처리 장치 및 방법 | |
JP5857634B2 (ja) | 単語間空白検出装置、単語間空白検出方法及び単語間空白検出用コンピュータプログラム | |
JP4706764B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5347793B2 (ja) | 文字認識装置、文字認識プログラムおよび文字認識方法 | |
JP2018055256A (ja) | 情報処理装置、情報処理方法及びプログラム | |
AU2017225022A1 (en) | Method, system and apparatus for processing image data | |
US20210303782A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP2017010187A (ja) | 画像処理装置及び画像処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20131203 |