JP2014127161A - 文字切り出し装置、文字認識装置、文字切り出し方法、およびプログラム - Google Patents
文字切り出し装置、文字認識装置、文字切り出し方法、およびプログラム Download PDFInfo
- Publication number
- JP2014127161A JP2014127161A JP2012285664A JP2012285664A JP2014127161A JP 2014127161 A JP2014127161 A JP 2014127161A JP 2012285664 A JP2012285664 A JP 2012285664A JP 2012285664 A JP2012285664 A JP 2012285664A JP 2014127161 A JP2014127161 A JP 2014127161A
- Authority
- JP
- Japan
- Prior art keywords
- character
- projection
- characters
- variance
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 230000011218 segmentation Effects 0.000 title claims abstract description 38
- 239000006185 dispersion Substances 0.000 claims abstract description 62
- 238000004364 calculation method Methods 0.000 claims abstract description 37
- 238000001514 detection method Methods 0.000 claims abstract description 30
- 238000009826 distribution Methods 0.000 claims description 18
- 238000003384 imaging method Methods 0.000 claims description 9
- 238000000926 separation method Methods 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 12
- 239000013598 vector Substances 0.000 description 10
- 238000000605 extraction Methods 0.000 description 9
- 230000000052 comparative effect Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 102100021753 Cardiolipin synthase (CMP-forming) Human genes 0.000 description 2
- 101000895518 Homo sapiens Cardiolipin synthase (CMP-forming) Proteins 0.000 description 2
- 101100385368 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) CSG2 gene Proteins 0.000 description 2
- 101150115304 cls-2 gene Proteins 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
Images
Landscapes
- Character Input (AREA)
Abstract
【解決手段】文字列の文字の区切り位置を検出する文字区切り位置検出部133は、領域設定部1331で設定される設定領域内において、文字が並んでいる方向の射影を生成する射影生成部1332と、文字並び方向の画素位置情報および文字並び方向上の文字並び方向に直交する方向に配列された画素値全体の平均画素値情報に関連付けた設定領域内の射影を所定の幅で2つの領域に分割し、分割した2つの領域ごとに、各領域内分散と、2つの領域間分散と、これら各領域内分散と領域間分散との分散比を各々計算する分割点算出部1333と、を含み、分割点算出部で求めた分散比が最大となる位置を求める。
【選択図】図2
Description
文字が正常な場合はよいが、文字がつぶれやノイズなどによって結合したような場合や、媒体の移動速度変動による画像解像度の低下(モジュレーションの劣化)の場合は、閾値のレベルによって文字境界の見逃しやノイズによる文字境界点の誤検出といった問題が生じやすく、結果的に安定的な認識性能が阻害されることになる。
文字認識装置10は、認識対象(切り出し対象)となる2文字を囲む暫定切り出し領域、たとえば矩形領域を設定し、少なくともその矩形領域において文字が並んでいる方向の射影を生成(形成)する。
文字認識装置10は、文字切り出し処理における射影生成に際し、文字が第1方向である横方向すなわちX軸方向に並んでいるときはX軸への射影を生成し、文字が第1方向に直交する第2方向である縦方向すなわちY軸方向に並んでいるときはY軸への射影を生成する。以下では、一例として、X軸への射影として説明する。
文字認識装置10は、その射影に関してその射影を左右に2分割したときに、その各分割要素において、たとえば要素内の分散が最も小さく、要素間の分散が最も大きくなるような分割点を選び、その選択した点を2文字の分割位置(境界位置)として検出する。
より具体的には、文字認識装置10は、射影に関してその射影を2分割したときに、その各分割要素において、たとえば分割要素内の射影値の分散が最も小さく、分割要素間の射影値の分散が最も大きくなるような分割点を選び、その選択した分割点を2文字の境界位置として検出する。
文字認識装置10は、分割点算出処理においては、設定される矩形領域内の文字の並び方向の各位置における所定幅の射影を2つの領域に分割し、各射影における分割領域内分散と分割領域間分散とを求め、その分散比を位置ごとに求め、求めた分散比に基づき2文字の境界位置(文字の区切り位置)を求める。本実施形態では、分散比が最大となる位置を文字の区切り位置として求める。
以上の判別処理については、後で詳述する。
また、データ処理部13は、2値化部131、文字列切り出し部としての行切り出し部132、文字区切り位置検出部を含む文字切り出し部133、特徴抽出部134、特徴比較部135、特徴辞書格納部136、および類似文字認識部137を有している。
なお、これらの各部は、記録担体20上の文字列、たとえばOCR文字列を認識する文字認識装置の一例として機能する。
画像メモリ12は、撮像素子11で撮像されたOCR文字列等の画像データを記憶(格納)する。
なお、この画像メモリ12は、RAM,SDRAM,DDRSDRAM,RDRAMなど、画像データを記憶しうるものであれば如何なるものであってもよい。
その後、データ処理部13が、画像メモリ12から画像データを読み出して、上述した各部において様々な処理を施し、最終的に、記録担体20上のOCR文字列から各文字を切り出して認識するように構成されている。
撮像素子11は、たとえばCCDやCMOSセンサにより形成される。
次に、データ処理部13の各部の基本的な構成および機能について説明する。
データ処理部13は、画像メモリ12から画像データを読み出して、その画像データが多諧調の濃淡画像である場合には、白黒2値の画像に変換を行う。
2値化部131は、適当な方法によって閾値を求め、元の画像を白黒2値の画像に変換する。
ここで、データ処理部13における以降の処理は、この白黒2値画像を用いて行われることとする。
そして、行切り出し部132は、上下エッジの中心位置を、文字列の中心ラインと識別して行切り出しを行う。
ここで、水平方向とは、文字が横方向に並んでいる第1方向、すなわちX軸方向である。
より具体的には、本実施形態の文字切り出し部133は、認識対象(切り出し対象)となる2文字を囲む暫定切り出し領域、たとえば矩形領域を設定し、その矩形領域において文字が並んでいる方向の射影を生成(形成)する。
ここでは、上述したように、文字切り出し部133は、射影生成に際し、文字が横方向すなわちX軸方向に並んでいるときはX軸への射影を生成する。
文字切り出し部133は、その射影に関してその射影を左右に2分割したときに、その各分割要素において、要素内の分散が最も小さく、要素間の分散が最も大きくなるような分割点を選び、その選択した点を2文字の境界位置(分割位置)として検出する。
より具体的には、後で詳述するように、文字切り出し部133は、射影に関してその射影を2分割したときに、その各分割要素において、分割要素内の射影値の分散が最も小さく、分割要素間の射影値の分散が最も大きくなるような分割点を選び、その選択した分割点を2文字の境界位置として検出する。
また、文字切り出し部133は、分割点算出処理においては、設定される矩形領域内の文字の並び方向の各位置における所定幅の射影を2つの領域に分割し、各射影における分割領域内分散と分割領域間分散とを求め、その分散比を位置ごとに求め、分散比が最大となる位置を求める。
なお、類似度が一定値を超える候補文字が複数個存在する場合には、文字認識を行うことができないので、類似文字認識部137は、特徴ベクトルから導き出せる2次的な特徴量を利用して、類似文字の判別を行う。
また、類似文字認識部137は、左右線対称や上下線対象と同様に点対称で類似性を調べるように構成してもよい。
次に、本実施形態に係る文字認識装置10における特徴的な機能を有する文字切り出し部133の文字区切り位置検出部おける文字の区切り位置の検出処理(文字切り出し処理)について詳細に説明する。
図2は、本実施形態に係る文字切り出し部における文字区切り位置検出部の構成例を示すブロック図である。
本実施形態に係る文字切り出し部133における文字区切り位置検出部1330は、図2に示すように、領域設定部1331、射影生成部1332、および分割点算出部1333を含んで構成されている。
分割点算出部1333は、その射影に関してその射影を左右に2分割したときに、その各分割要素において、要素内の分散が最も小さく、要素間の分散が最も大きくなるような分割点を選び、その選択した点を2文字の境界位置(分割位置)として検出する。
そして、文字切り出し部133は、分割点算出部1333で求めた分散比が最大となる位置を求める。
換言すれば、分割点算出部1333は、生成された射影に関してその射影を左右に2分割したときに、各分割要素(分割領域)において分割要素(分割領域)内の射影値の分散が最も小さく、分割要素間(分割領域間)の射影値の分散が最も大きくなるような分割点を選択し、その選択した点を2文字の境界位置(分割位置)として検出する。
分割点算出部1333は、分割点算出処理においては、設定される矩形領域内の文字の並び方向の各位置における所定幅の射影を2つの領域に分割し、各射影における分割領域内分散と分割領域間分散とを求め、その分散比を位置ごとに求め、分散比が最大となる位置を求める。
ただし、本発明はこの構成だけではなく、たとえば文字列全体に対して射影を生成しておき、分割点算出部1333において分割点算出処理を行うときに、設定領域に対しその設定領域に対応する射影データを用いるように構成することも可能である。
その後、本実施形態に係る文字切り出し部のより具体的な処理例について説明する。
図4は、本実施形態に係る文字切り出し部における文字区切り位置検出部の処理フローを示すフローチャートである。
ここでは、比較例の文字切り出し処理について述べた後、本実施形態に係る文字切り出し処理技術について説明する。
比較例では、図3に示すように、まず、ステップST1において一つの文字列ラインについて水平軸への垂直射影を計算(生成)する。
この垂直射影計算は、より具体的には、文字列の方向にシフトさせながら、文字列の垂直方向(X軸)へ濃度投影を行い、垂直射影データを計算する。
なお、濃度投影とは、いわばヒストグラム(濃度分布図)の一種であり、2値化によって「1」または「0」の濃度に変換された画素を、濃度別に合計したものであり、白または黒のどちらを合計値として計算してもよい。
この垂直射影計算法は、本実施形態においても適用可能である。
この射影の計算では、垂直方向の画素の加算(または算術平均)を行うが、その加算範囲は、たとえば文字行切り出し部において求めた文字列ライン上限エッジを両端点とする範囲に設定する(ステップST2)。
ステップST3において、得られた射影プロフィルに対して、あらかじめ定めしておいた閾値SLEVとこの射影プロファイルのレベル値を比較し、閾値SLEVを超えている区間を文字と文字の間のスペースと判定する。
境界位置は、たとえばスペースの両端点の中点に設定する。
そこで、本実施形態においては、図2に示すような構成が採用されている。
図2の文字区切り位置検出部1330では、まず、図3に示すように、ステップST11において、領域設定部1331により、認識処理対象のうち隣接する2文字を囲む矩形の暫定切り出し領域RCTが設定される。
次に、ステップST12において、射影生成部1332により、領域設定部1331で設定された矩形領域RCT内において文字が並んでいる方向の射影が生成(形成)される。
具体的には、射影生成部1332では、文字が横方向すなわちX軸方向に並んでいるときはX軸への射影が生成され、文字が縦方向に並んでいるときはY軸への射影が生成される。
そして、ステップST13において、分割点算出部1333により、X軸方向の画素位置情報およびX軸上のY方向に配列された画素値全体の平均画素値情報に関連付けた設定領域内において生成された射影に関してその射影を左右に2分割したときに、各分割要素(分割領域)において分割要素(分割領域)内の射影値の分散が最も小さく、分割要素(分割領域)間の射影値の分散が最も大きくなるような分割点が選択され、その選択した点が2文字の境界位置(分割位置)として選定される。
次に、このような特徴を有する文字切り出し部133における文字区切り位置検出部1330の文字切り出し処理例について、図5から図11に関連付けてより具体的に説明する。
図6は、本実施形態に係る領域設定部により図5の画像の一部に設定される矩形領域の一例を示す図である。
図7は、本実施形態に係る射影生成部により図6の矩形領域内に形成される射影の特性曲線の一例を示す図である。
図8は、図7の射影特性曲線に矩形領域を2つに分割した場合の領域(クラス)内分散と領域(クラス)間分散の分散比特性曲線を付加した図である。
図9は、求められた文字間の分割位置(境界位置)を示す図である。
なお、図7および図8において、横軸は画像のX軸方向(水平方向)の画素位置情報(座標)を、縦軸は同じくX軸上のY方向に配列された画素値全体の平均画素値を、それぞれ表している。
図5の例では、文字「0」、「1」、「2」、「3」、「4」、「5」を含む文字列の画像が示されている。
この文字列は、一例として、記録担体20のOCR文字記録領域21に印刷された文字を撮像したときの画像データに相当している。なお、図5の数字の配列は、たとえば生年月日(01月23日1945年)等の数字のみを選択的に読み出した一例を示す。このような数字配列の他例としては、カード等の有効期限等をあげることができる。
この例では、文字の配列方向(並んでいる方向)において、隣接する文字「0」と「1」が近接し、隣接する文字「2」と「3」が近接し、隣接する文字「4」と「5」が近接している。
また、図5の例では、文字「1」と「2」間、文字「3」と「4」間は余白が多く、2文字の境界が明確となっている。
すなわち、領域設定部1331が、認識対象とする隣接2文字の全体を含むように矩形領域を設定する。ここでは、隣接文字列「4」と「5」を一例として取り上げる。
この場合、図6に示すように、文字列「45」を囲むように矩形領域RCTAが設定される。
文字列の位置がわからない場合には、適切な方法によって文字列の垂直方向の位置を決定し、その情報に基づいて矩形領域RCTAの上辺と下辺の位置を決めればよい。
文字列の横方向の位置が一定でない場合は、適切な方法によって文字列の水平方向の位置を決定し、その情報に基づいて矩形領域の左辺と右辺の位置を決めればよい。
文字位置の誤差を考慮して、実際の文字の縁位置から適当な余白を設けるようにすることが望ましい。
射影は文字の画像をX軸方向に投影したものであり(たとえば画素値の平均をとっているものであり)、図6の「45」の部分に対して射影を求めた結果の射影PRJの特性曲線が、図7に示されている。
なお、上述したように、図7において、横軸は画像のX軸方向(水平方向)の画素位置情報(座標)を表し、縦軸は同じくX軸上のY方向に配列された画素値全体の平均画素値を表している。
この例では「4」と「5」が結合したような状態となっているため、文字の境界位置が投影上で明確な谷間となって現れないことに注意する。
しかし、この射影パターンに基づいて、閾値による既存方式によるアプローチでこの谷底を検出しようとする場合、閾値がこの谷底BTより深い位置に設定されていると、この谷底BTを検出することができない、
したがって、適切な閾値を用いる必要があるが、谷底のレベル変動に柔軟に対応する閾値を設定することは難しい。
その具体的な方法(分割点算出部の処理)について説明する。
ここで、変数t(1<t<N)を導入し、i=tにおいて射影p(i)をp1=p(1:t)とp2=p(t+1:N)の2つの要素(領域)、クラスCLS1およびクラスCLS2に分割する。
クラスCLS1内およびクラスCLS2内の平均値m1およびm2は次式で求められる。
すなわち、i=tの各位置における射影p(i)を2つの領域に分割し、各射影における分割領域内分散と分割領域間分散とをtの値を変えながら求め、各tにおける分散比を求め、分散比が最大となるtの値を求める。
図8において、t=30で分散比Rs(t)は最大となるので、ここが求める境界位置(境界点、分割点)BNPとなる。
実際に、この境界位置(境界点)BNPで元の画像を分割してみると、図9に示すようになり、ほぼ目視により境界点と一致していることがわかる。
本実施形態においては、判別分析法を適用するが、一般的な判別分析法とは用いるデータの取り方が異なる。
すなわち、本実施形態の分析判別処理においては、X軸方向(水平方向、文字が並んでいる文字並び方向)の画素位置情報およびX軸上のX軸方向に直交するY方向に配列された画素値全体の平均画素値情報(各列の画素値全体の平均画素値情報)に関連付けた射影特性に関連付けられる設定領域において、次の処理を行う。
すなわち、設定領域内の射影を所定の幅で2つの領域に分割し、分割した2つの領域ごとに、各領域内分散と、2つの領域間分散と、これら各領域内分散と領域間分散との分散比を各々計算し、求めた分散比が最大となる位置を求めている。
この分散比が最大となる位置を含む領域は、射影RPJのY方向に配列された画素値全体の平均画素値分布において、列の平均画素値が最も低い領域を含む領域に対応して存在している。
しかし、この場合、全画素における平均画素値であることから、各列ごとのように局所的な判別情報を高い精度で得ることは困難で、文字の境界位置を高い精度で的確に決定することには限界がある。
これに対して、上述したように、本実施形態のように、X軸方向の画素位置情報およびX軸上のY方向に配列された画素値全体の平均画素値情報(各列の画素値全体の平均画素値情報)を適用することは、煩雑な閾値処理を行うことなく、境界があいまいなもの、明確なものに限らず、文字の境界位置を高い精度で的確に決定することが可能となる。
図11は、図10の矩形領域内に形成される射影の一例およびその射影特性曲線に矩形領域を2つに分割した場合の領域(クラス)内分散と領域(クラス)間分散の分散比特性曲線を付加した図である。
図11において、横軸は画像のX軸方向(水平方向)の画素位置情報(座標)を、縦軸は同じくX軸上のY方向に配列された画素値全体の平均画素値を、それぞれ表している。
この場合、分散比Rs(t)の最大値は、図11に示すように、連続するため、平坦部分の中央点を境界位置(境界点、分割点)に選択するなどの方法を採用することが可能である。
次に、本実施形態に係る文字認識装置10の全体的な動作について図12に関連付けて説明する。
図12は、本実施形態に係る文字認識装置10の全体の動作を説明するためのフローチャートである。
より具体的には、データ処理部13においては、画像メモリ12から画像データを読み出して、その画像データが多諧調の濃淡画像である場合には、2値化部131で濃淡画像が白黒2値の画像に変換される。
より具体的には、行切り出し部132において、2値化部131で2値化された文字列が水平方向に射影されて、文字列の上下エッジが検出される。
そして、行切り出し部132においては、上下エッジの中心位置が、文字列の中心ラインと識別され行切り出しが行われる。
より具体的には、文字切り出し部133の文字区切り位置検出部1330において、認識対象となる2文字を囲む暫定切り出し矩形領域が領域設定部1331により設定される。そして、射影生成部1332においてその矩形領域において射影が生成される。
たとえば、上述したように、射影形成に際し、文字が横方向すなわちX軸方向に並んでいるときはX軸への射影が形成される。
そして、分割点算出部1333において、X軸方向の画素位置情報およびX軸上のY方向に配列された画素値全体の平均画素値情報に関連付けた設定領域内において生成された射影に関してその射影が左右に2分割されたときに、その各分割要素(分割領域)において、要素(領域)内の分散が最も小さく、要素(領域)間の分散が最も大きくなるような分割点が選択され、その選択した点が2文字の境界位置(分割位置)として検出される。
より具体的には、分割点算出部1333において、生成された射影に関してその射影を左右に2分割されたときに、各分割要素(分割領域)において分割要素(分割領域)内の射影値の分散が最も小さく、分割要素間(分割領域間)の射影値の分散が最も大きくなるような分割点が選択され、その選択した点が2文字の境界位置(分割位置)として検出される。
より具体的には、特徴抽出部134においては、上述した外接矩形領域が任意のサブ領域に分割(たとえば1個の外接矩形領域を5×5の領域に分割され、そのうち1個の領域がサブ領域とされる)され、各サブ領域において、サブ領域内の全画素数に占める黒画素数の割合が求められ、それらを要素とする特徴ベクトルが生成される。
より具体的には、特徴比較部135においては、ステップST106で求めた特徴ベクトルが、あらかじめこの媒体で使用される全文字について求められてあらかじめ特徴辞書格納部136に格納されている基準特徴ベクトルと比較されて、類似度(たとえば正規化相関係数)が最も高いものをその文字が該当する候補文字に設定される。
より具体的には、ステップST107の特徴比較によって設定された候補文字が、媒体に用いられた文字として認識される。
なお、類似度が一定値を超える候補文字が複数個存在する場合には、文字認識を行うことができないので、類似文字認識部137において、特徴ベクトルから導き出せる2次的な特徴量を利用して、類似文字の判別が行われる。
文字認識装置10は、X軸方向(文字が並んでいる文字並び方向)の画素位置情報およびX軸上のY方向に配列された画素値全体の平均画素値情報(各列の画素値全体の平均画素値情報)に関連付けた射影特性に関連付けられる設定領域において、次の処理を行う。
文字認識装置10は、その射影に関してその射影を左右に2分割したときに、その各分割要素において、要素内の分散が最も小さく、要素間の分散が最も大きくなるような分割点を選び、その選択した点を2文字の境界位置(分割位置)として検出する。
より具体的には、分割点算出部1333は、生成された射影に関してその射影を左右に2分割したときに、各分割要素(分割領域)において分割要素(分割領域)内の射影値の分散が最も小さく、分割要素間(分割領域間)の射影値の分散が最も大きくなるような分割点を選択し、その選択した点を2文字の境界位置(分割位置)として検出する。
その結果、煩雑な閾値処理を行うことなく、境界があいまいなものについても境界線を設定することができる。
また、本実施形態によれば、文字の境界が明確なケースに本方式を適用しても同様の結果を得ることができる。
また、本実施形態の文字認識装置10は、カードのみならず、パスポート、運転免許証など、あらゆる媒体への適用が可能である。
また、このようなプログラムは、半導体メモリ、磁気ディスク、光ディスク、フロッピー(登録商標)ディスク等の記録媒体、この記録媒体をセットしたコンピュータによりアクセスし上記プログラムを実行するように構成可能である。
Claims (10)
- 媒体上の文字列を撮像して得られた画像データを処理することによって、前記文字列から各文字を切り出す文字切り出し装置であって、
前記文字列を形成する文字の区切り位置を検出する文字区切り位置検出部を有し、
前記文字区切り位置検出部は、
前記文字の区切り位置を検出する領域を設定する領域設定部と、
少なくとも前記領域設定部により設定される設定領域内において、文字が並んでいる方向の射影を生成する射影生成部と、
前記文字が並んでいる文字並び方向の画素位置情報および当該文字並び方向上の当該文字並び方向に直交する方向に配列された画素値全体の平均画素値情報に関連付けた前記設定領域内の前記射影を所定の幅で2つの領域に分割し、分割した2つの領域ごとに、各領域内分散と、2つの領域間分散と、これら各領域内分散と領域間分散との分散比を各々計算する分割点算出部と、を含み、
前記分割点算出部で求めた前記分散比に基づき文字の区切り位置を求める
文字切り出し装置。 - 前記文字並び方向の画素位置情報および当該文字並び方向上の当該文字並び方向に直交する方向に配列された画素値全体の平均画素値情報に関連付けて形成される射影特性において、前記分散比に基づき文字の区切り位置を含む領域は、射影特性の文字並び方向に直交する方向に配列された画素値全体の平均画素値の分布において、当該平均画素値が低い領域を含む領域に対応して存在する
請求項1記載の文字切り出し装置。 - 前記文字区切り位置検出部は、
前記分割点算出部が、射影に関してその射影を2分割したときに、その各分割要素において、要素内の分散が小さく、要素間の分散が大きくなるような分割点を選び、
当該選択した分割点を2文字の境界位置として検出する
請求項1または2記載の文字切り出し装置。 - 前記文字区切り位置検出部は、
前記分割点算出部が、射影に関してその射影を2分割したときに、その各分割要素において、分割要素内の射影値の分散が小さく、分割要素間の射影値の分散が大きくなるような分割点を選び、
当該選択した分割点を2文字の境界位置として検出する
請求項3記載の文字切り出し装置。 - 前記分割点算出部は、
前記設定領域内の文字の並び方向の各位置における所定幅の射影を2つの領域に分割し、各射影における分割領域内分散と分割領域間分散とを求め、その分散比を位置ごとに求め、分散比に基づき文字の区切り位置を求める
請求項1から4のいずれか一に記載の文字切り出し装置。 - 前記射影生成部は、
文字が第1方向に並んでいるときは当該第1方向の射影を生成し、
文字が第1方向と直交する方向の第2方向に並んでいるときは当該第2方向の射影を生成する
請求項1から5のいずれか一に記載の文字切り出し装置。 - 画像データから切り出された文字列から各文字を切り出して文字を認識する文字認識装置であって、
媒体上の文字列を撮像して画像データとして読み取る画像読取部と、
前記画像読取部による読み取り画像を格納する画像メモリと、
前記画像メモリに格納された前記画像データから文字列を切り出し、当該文字列から文字を切り出して文字認識を行うデータ処理部と、を有し、
前記データ処理部は、
切り出された前記文字列を形成する文字の区切り位置を検出する文字区切り位置検出部を備えた文字切り出し部と、を含み、
前記文字区切り位置検出部は、
前記文字の区切り位置を検出する領域を設定する領域設定部と、
少なくとも前記領域設定部により設定される設定領域内において、文字が並んでいる方向の射影を生成する射影生成部と、
前記文字が並んでいる文字並び方向の画素位置情報および当該文字並び方向上の当該文字並び方向に直交する方向に配列された画素値全体の平均画素値情報に関連付けた前記設定領域内の前記射影を所定の幅で2つの領域に分割し、分割した2つの領域ごとに、各領域内分散と、2つの領域間分散と、これら各領域内分散と領域間分散との分散比を各々計算する分割点算出部と、を含み、
前記分割点算出部で求めた前記分散比に基づき文字の区切り位置を求める
文字認識装置。 - 前記文字並び方向の画素位置情報および当該文字並び方向上の当該文字並び方向に直交する方向に配列された画素値全体の平均画素値情報に関連付けて形成される射影特性において、前記分散比に基づき文字の区切り位置を含む領域は、射影特性の文字並び方向に直交する方向に配列された画素値全体の平均画素値の分布において、当該平均画素値が低い領域を含む領域に対応して存在する
請求項7記載の文字認識装置。 - 媒体上の文字列を撮像して得られた画像データを処理することによって、前記文字列から各文字を切り出す文字切り出し方法であって、
前記文字列を形成する文字の区切り位置を検出する文字区切り位置検出ステップを有し、
前記文字区切り位置検出ステップは、
前記文字の区切り位置を検出する領域を設定する領域設定ステップと、
少なくとも前記領域設定ステップにより設定される設定領域内において、文字が並んでいる方向の射影を生成する射影生成ステップと、
前記文字が並んでいる文字並び方向の画素位置情報および当該文字並び方向上の当該文字並び方向に直交する方向に配列された画素値全体の平均画素値情報に関連付けた前記設定領域内の前記射影を所定の幅で2つの領域に分割し、分割した2つの領域ごとに、各領域内分散と、2つの領域間分散と、これら各領域内分散と領域間分散との分散比を各々計算する分割点算出ステップと、を含み、
前記分割点算出ステップで求めた前記分散比に基づき文字の区切り位置を求める
文字切り出し方法。 - 媒体上の文字列を撮像して得られた画像データを処理することによって、前記文字列から各文字を切り出す文字切り出し処理をコンピュータに実行させるプログラムであって、
前記文字列を形成する文字の区切り位置を検出する文字区切り位置検出処理を有し、
前記文字区切り位置検出処理は、
前記文字の区切り位置を検出する領域を設定する領域設定処理と、
少なくとも前記領域設定処理により設定される設定領域内において、文字が並んでいる方向の射影を生成する射影生成処理と、
前記文字が並んでいる文字並び方向の画素位置情報および当該文字並び方向上の当該文字並び方向に直交する方向に配列された画素値全体の平均画素値情報に関連付けた前記設定領域内の前記射影を所定の幅で2つの領域に分割し、分割した2つの領域ごとに、各領域内分散と、2つの領域間分散と、これら各領域内分散と領域間分散との分散比を各々計算する分割点算出処理と、を含み、
前記分割点算出処理で求めた前記分散比に基づき文字の区切り位置を求める
文字切り出し処理をコンピュータに実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012285664A JP6039413B2 (ja) | 2012-12-27 | 2012-12-27 | 文字切り出し装置、文字認識装置、文字切り出し方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012285664A JP6039413B2 (ja) | 2012-12-27 | 2012-12-27 | 文字切り出し装置、文字認識装置、文字切り出し方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014127161A true JP2014127161A (ja) | 2014-07-07 |
JP6039413B2 JP6039413B2 (ja) | 2016-12-07 |
Family
ID=51406555
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012285664A Expired - Fee Related JP6039413B2 (ja) | 2012-12-27 | 2012-12-27 | 文字切り出し装置、文字認識装置、文字切り出し方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6039413B2 (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015197681A (ja) * | 2014-03-31 | 2015-11-09 | 日本電産サンキョー株式会社 | 文字認識装置およびその文字切り出し方法 |
JP2016194800A (ja) * | 2015-03-31 | 2016-11-17 | 日本電産サンキョー株式会社 | 文字切り出し装置、文字認識装置、および文字切り出し方法 |
CN106778758A (zh) * | 2016-12-29 | 2017-05-31 | 成都数联铭品科技有限公司 | 用于图像文字识别的字符切分方法 |
CN107392206A (zh) * | 2017-07-21 | 2017-11-24 | 武汉理工大学 | 一种工况条件下钢轨压印字符分割方法 |
CN109543770A (zh) * | 2018-11-30 | 2019-03-29 | 合肥泰禾光电科技股份有限公司 | 点阵字符识别方法及装置 |
CN110096980A (zh) * | 2019-04-20 | 2019-08-06 | 东莞中科蓝海智能视觉科技有限公司 | 字符检测识别系统 |
CN111754525A (zh) * | 2020-06-23 | 2020-10-09 | 苏州中科全象智能科技有限公司 | 一种基于非精确切分的工业字符检测流程 |
CN111967474A (zh) * | 2020-09-07 | 2020-11-20 | 北京凌云光技术集团有限责任公司 | 基于投影的文本行字符分割方法及装置 |
CN114612892A (zh) * | 2022-03-17 | 2022-06-10 | 佛山市南海区广工大数控装备协同创新研究院 | 一种pcb元器件表面3d字符分割方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61269779A (ja) * | 1985-05-24 | 1986-11-29 | Agency Of Ind Science & Technol | 文書画像解析方式 |
JPH0816719A (ja) * | 1994-06-29 | 1996-01-19 | Canon Inc | 文字切り出し方法とこれを用いた文字認識方法及び装置 |
JPH1055408A (ja) * | 1996-06-06 | 1998-02-24 | Fujitsu Ltd | 接触パターンを分離するパターン分離装置および方法 |
JP2007256254A (ja) * | 2006-02-24 | 2007-10-04 | Nagaoka Univ Of Technology | 流水領域検出システム、流水領域検出方法、及びプログラム |
JP2008097590A (ja) * | 2006-09-13 | 2008-04-24 | Keyence Corp | 文字切り出し装置、方法およびプログラム |
-
2012
- 2012-12-27 JP JP2012285664A patent/JP6039413B2/ja not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61269779A (ja) * | 1985-05-24 | 1986-11-29 | Agency Of Ind Science & Technol | 文書画像解析方式 |
JPH0816719A (ja) * | 1994-06-29 | 1996-01-19 | Canon Inc | 文字切り出し方法とこれを用いた文字認識方法及び装置 |
JPH1055408A (ja) * | 1996-06-06 | 1998-02-24 | Fujitsu Ltd | 接触パターンを分離するパターン分離装置および方法 |
JP2007256254A (ja) * | 2006-02-24 | 2007-10-04 | Nagaoka Univ Of Technology | 流水領域検出システム、流水領域検出方法、及びプログラム |
JP2008097590A (ja) * | 2006-09-13 | 2008-04-24 | Keyence Corp | 文字切り出し装置、方法およびプログラム |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015197681A (ja) * | 2014-03-31 | 2015-11-09 | 日本電産サンキョー株式会社 | 文字認識装置およびその文字切り出し方法 |
JP2016194800A (ja) * | 2015-03-31 | 2016-11-17 | 日本電産サンキョー株式会社 | 文字切り出し装置、文字認識装置、および文字切り出し方法 |
CN106778758A (zh) * | 2016-12-29 | 2017-05-31 | 成都数联铭品科技有限公司 | 用于图像文字识别的字符切分方法 |
CN107392206A (zh) * | 2017-07-21 | 2017-11-24 | 武汉理工大学 | 一种工况条件下钢轨压印字符分割方法 |
CN107392206B (zh) * | 2017-07-21 | 2020-03-10 | 武汉理工大学 | 一种工况条件下钢轨压印字符分割方法 |
CN109543770A (zh) * | 2018-11-30 | 2019-03-29 | 合肥泰禾光电科技股份有限公司 | 点阵字符识别方法及装置 |
CN110096980A (zh) * | 2019-04-20 | 2019-08-06 | 东莞中科蓝海智能视觉科技有限公司 | 字符检测识别系统 |
CN111754525A (zh) * | 2020-06-23 | 2020-10-09 | 苏州中科全象智能科技有限公司 | 一种基于非精确切分的工业字符检测流程 |
CN111967474A (zh) * | 2020-09-07 | 2020-11-20 | 北京凌云光技术集团有限责任公司 | 基于投影的文本行字符分割方法及装置 |
CN111967474B (zh) * | 2020-09-07 | 2024-04-26 | 凌云光技术股份有限公司 | 基于投影的文本行字符分割方法及装置 |
CN114612892A (zh) * | 2022-03-17 | 2022-06-10 | 佛山市南海区广工大数控装备协同创新研究院 | 一种pcb元器件表面3d字符分割方法 |
CN114612892B (zh) * | 2022-03-17 | 2024-04-09 | 佛山市南海区广工大数控装备协同创新研究院 | 一种pcb元器件表面3d字符分割方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6039413B2 (ja) | 2016-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6039413B2 (ja) | 文字切り出し装置、文字認識装置、文字切り出し方法、およびプログラム | |
JP6268023B2 (ja) | 文字認識装置およびその文字切り出し方法 | |
CN109543501B (zh) | 图像处理装置、图像处理方法和存储介质 | |
JP5334042B2 (ja) | 文字列認識方法及び文字列認識装置 | |
JP6143111B2 (ja) | 物体識別装置、物体識別方法、及びプログラム | |
JP5500480B2 (ja) | 帳票認識装置及び帳票認識方法 | |
JP6171167B2 (ja) | 文字認識装置、文字認識方法、及び文字認識プログラム | |
JP4658848B2 (ja) | 文字列認識方法及び文字列認識装置 | |
JP2011227636A (ja) | 文字列認識装置および文字列認識方法 | |
JP6487255B2 (ja) | 文字切り出し装置、文字認識装置、および文字切り出し方法 | |
US20100166318A1 (en) | Adaptive partial character recognition | |
US20080304743A1 (en) | Active segmentation for groups of images | |
JP6599672B2 (ja) | 文字切り出し装置、文字認識装置、および文字切り出し方法 | |
JP5754055B2 (ja) | 物体または形状の情報表現方法 | |
JP2009223414A (ja) | 一致度計算装置及び方法、プログラム | |
JP2018055255A (ja) | 情報処理装置、情報処理方法及びプログラム | |
US20120082372A1 (en) | Automatic document image extraction and comparison | |
JP5011508B2 (ja) | 文字列認識方法及び文字列認識装置 | |
US20080123933A1 (en) | Method and apparatus for magnetic character recognition | |
Zhu et al. | End-to-end system of license plate localization and recognition | |
JP2018055496A (ja) | 媒体認識装置および媒体認識方法 | |
Bhole et al. | An image forgery detection using SIFT-PCA | |
JP2005250786A (ja) | 画像認識方法 | |
JP2015099536A (ja) | 図表領域検出装置および図表領域検出方法 | |
Do et al. | A Covariance-matching-based Model for Musical Symbol Recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20151106 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160916 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161025 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161104 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6039413 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |