JP5343617B2 - 文字認識プログラム、文字認識方法および文字認識装置 - Google Patents
文字認識プログラム、文字認識方法および文字認識装置 Download PDFInfo
- Publication number
- JP5343617B2 JP5343617B2 JP2009042278A JP2009042278A JP5343617B2 JP 5343617 B2 JP5343617 B2 JP 5343617B2 JP 2009042278 A JP2009042278 A JP 2009042278A JP 2009042278 A JP2009042278 A JP 2009042278A JP 5343617 B2 JP5343617 B2 JP 5343617B2
- Authority
- JP
- Japan
- Prior art keywords
- graph
- character
- unit
- pattern
- character recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/15—Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/19007—Matching; Proximity measures
- G06V30/19013—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
- G06V30/1902—Shifting or otherwise transforming the patterns to accommodate for positional errors
- G06V30/1904—Shifting or otherwise transforming the patterns to accommodate for positional errors involving a deformation of the sample or reference pattern; Elastic matching
- G06V30/19047—Shifting or otherwise transforming the patterns to accommodate for positional errors involving a deformation of the sample or reference pattern; Elastic matching based on a local optimisation criterion, e.g. "snakes", i.e. active contour models of the pattern to be recognised
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Description
一般的なOCR機能は、認識の効率を向上させるためや、文字の切り出し候補の増大による切り出し誤りの発生を回避するために、他の文字と接触している可能性のある接触パターンと一文字である可能性の高い孤立文字パターンとを判定する機能を所持する。
一方、接触パターンと判定された候補(接触パターン候補)に対しては、セグメンテーション(切り出しおよび認識)が行われる。
しかしながら、接触パターンであっても文字列方向の長さや、パターンの縦横比(W/H)では孤立文字パターンと区別できないケースが存在し、接触パターン候補の判定漏れを起こして文字認識誤りの一因となっている。
比較手順は、一文字であると判定された判定対象パターンの構造を、記憶部に記憶された一文字パターンの構造と比較する。
このような文字認識プログラムによれば、比較手順により、一文字であると判定された判定対象パターンの構造が、記憶部に記憶された一文字パターンの構造と比較される。判定手順により、比較手順の比較結果に基づいて、判定対象パターンが複数の文字を含むパターンか否かが判定される。
まず、実施の形態の文字認識装置について説明し、その後、実施の形態をより具体的に説明する。
文字認識装置(コンピュータ)1は、比較手段2および判定手段3として機能する。
比較手段2は、一文字であると判定された判定対象パターンの構造を、記憶部4に記憶された一文字パターンの構造と比較する。この一文字パターンの構造は、判定対象パターンが一文字である場合にその文字を識別するために予め用意されたパターンの構造である。また、記憶部4は、文字認識装置1内に設けられていてもよいし、文字認識装置1の外部に設けられていてもよい。
この判定対象パターン5は、数字「6」に数字「2」が接触したパターンであるにもかかわらず、一文字であると判定されたパターンである。この判定対象パターン5が、後述するルールにより整形され、頂点と辺とを有する構造6になっている。
比較手段2は、構造6を、一文字パターンの構造4a、4b、4cとそれぞれ比較する。例えば、構造6が、構造4a、4b、4cと同型部分を含むか否かを比較する。
判定手段3は、比較手段2の比較結果に基づいて、判定対象パターンを一文字であるか否かを判定する。
予め定められた閾値以上である場合に、判定対象パターン5が一文字であると判定する。一方、そうでなければ、接触パターンであると判定する。
このような文字認識装置1によれば、構造を比較することで、文字の接触パターンを精度よく判定することができる。
図2は、文字認識装置のハードウェア構成例を示す図である。
文字認識装置10は、CPU(Central Processing Unit)101によって装置全体が制御されている。CPU101には、バス109を介してRAM(Random Access Memory)102、ハードディスクドライブ(HDD:Hard Disk Drive)103、グラフィック処理装置104、入力インタフェース105、106、外部補助記憶装置107、および通信インタフェース108が接続されている。
文字認識装置10は、2値化部11と、行切り出し部12と、ラベリング部13と、文字認識用辞書格納部14と、文字認識部15と、変形モデルグラフ生成部16と、変形モデルグラフ格納部17と、接触パターン候補判定部18と、接触パターンセグメンテーション部19と、出力部20とを有している。
行切り出し部12は、2値化部11によって2値化された帳票画像から文字の行(文字行)を切り出す。以下、切り出された文字行に含まれる文字のパターンを「判定対象パターン」と言う。
文字認識用辞書格納部14は、文字認識に使用する文字認識用辞書を格納している。
変形モデルグラフ生成部16は、接触パターン候補判定に使用する文字種毎の変形モデルグラフを生成し、変形モデルグラフ格納部17に格納する。なお、変形モデルグラフおよびその生成方法については、後に詳述する。
出力部20は、判定対象パターンの文字認識結果をモニタ104aに出力する。
図4は、文字認識辞書のデータ構成を示す図である。
データテーブル14aは、文字種毎に、変形モデルグラフの数が設定されている。そして、変形モデルグラフ毎に、変形モデルグラフを識別する番号が付されており、変形モデルグラフ毎に、モデルの頂点数、モデルの辺数、モデルの頂点隣接行列、モデルの頂点と辺の接続行列が設定されている。
また、モデルの頂点と辺の接続行列は、頂点と辺の接続関係を「0」と「1」で表す行列であり、例えば、頂点数が「n」で辺数が「m」のとき、n行m列の行列である。
図5は、変形モデルグラフのデータ構成を示す図である。
図6は、変形モデルグラフ生成部の構成を示す図である。
変形モデルグラフ生成部16は、文字種指定受付部161と、データ読込部162と、文字線幅推定部163と、細線化部164と、グラフ化部165と、グラフ整形部166と、変形モデルグラフ生成・登録部167と、変形モデルグラフ表示部168と、削除指定受付部169と、不正変形モデルグラフ削除部170とを有している。
データ読込部162は、文字種指定受付部161が受け付けた文字種の2値の学習用の一文字画像データを、例えば、予め用意されたデータベースから読み込む。以下、一文字画像データに含まれる文字のパターンを「一文字パターン」と言う。
細線化部164は、一文字パターンを細線化する。
グラフ化部165は、細線化部164が細線化した一文字パターンに対し、頂点と、頂点間の辺とを抽出する。そして抽出した辺および頂点の、接続関係および隣接関係を求めることで一文字パターンをグラフ化する。
不正変形モデルグラフ削除部170は、削除指定受付部169が受け付けた削除情報に基づいて、削除指定された変形モデルグラフに対応するデータを登録された変形モデルグラフデータから削除する。また、残っている変形モデルグラフのモデル番号を修正する。
<グラフ化部>
グラフ化部165は、細線化部164で得られた細線化された一文字パターンを、グラフで表現する。具体的には、まず、細線化された一文字パターンから頂点座標と次数を求める。次に、頂点間の辺を追跡し、辺の各点の座標、辺の長さ、接続する頂点番号を求める。また、各頂点に接続する辺の番号を求める。
(1)グラフ情報
グラフを構成する辺・頂点の数、頂点隣接行列、辺と頂点の接続行列を計算し、グラフ情報構造体に格納する。
(2)辺情報
各辺の、長さ、接続する2頂点の番号、辺の軌跡の座標を計算し、辺情報構造体に格納する。
(3)頂点情報
各頂点の、座標、次数、接続する辺の番号を計算し、頂点情報構造体に格納する。
<辺情報構造体>
struct Edge_inf{
short *vertexNo; 接続する頂点番号配列
short *xcood; 辺の各点(軌跡)のx座標配列ポインタ
short *ycood; 辺の各点(軌跡)のy座標配列ポインタ
short length; 辺の長さ
short vn1, vn2; 辺に接続する2頂点の番号
};
<頂点情報構造体>
struct Vertex_inf{
short x, y; 頂点座標のx、y座標
short degree; 頂点の次数
short *edgeNo; 接続する辺番号配列ポインタ
short counter; 辺追跡時のカウンタ
};
<グラフ情報構造体>
struct Graph_inf{
struct Edge_inf *edge; 辺情報構造体ポインタ
short edgeNo; 辺の数
struct Vertex_inf *vertex; 頂点情報構造体ポインタ
short vertexNo; 頂点数
short *smatrix; 接続行列ポインタ
short *bmatrix; 隣接行列ポインタ
};
<グラフ整形部>
グラフ整形部166は、一文字パターンから得られたグラフを整形する。
図7は、グラフの整形を説明する図である。
グラフ整形部166は、グラフ化部165が求めた辺・頂点の構造体を削除・分割・追加する処理を行い、隣接行列・接続行列を再計算する。
この場合、次数が「1」の頂点v3を削除する。頂点v3を削除した後、次数が「1」でない方の頂点の次数を「1」減らす。すなわち、図7(c)に示すように、辺e3に対応する辺情報構造体を除き、頂点v2に対応する頂点情報構造体のメンバーの次数を「3」から「2」にする。更に、接続する辺番号配列から削除した辺番号を除く。これは、接続する辺の数が減るためである。
図7(d)に示す例では、頂点v2を除き、辺e2と辺e4とを統合し辺e2とする。すなわち、頂点v2に対応する頂点情報構造体構造体を除き、辺e2と辺e4の辺情報構造体を統合して一つにする。
図7(e)に示す例では、ループに次数が「2」の頂点v2、v3を付加し、辺e1を辺e1a、e3、e4に分割する。すなわち、頂点v2、v3に対応する頂点情報構造体を作成し、その位置座標を辺e1の辺情報構造体の辺の各点の任意の2点とする。これによって、辺e1に対応する辺情報構造体を三つに分割し、辺e1a、e3、e4に対応する辺情報構造体を作成する。
次に、変形モデルグラフ生成・登録部167の処理を詳しく説明する。
変形モデルグラフ生成・登録部167は、整形されたグラフの最初(1番目)の作成対象パターンにおいては、無条件に、その文字種の変形モデルグラフとして登録し、対象文字種の変形モデルグラフの数を「1」とする。
図8は、変形モデルグラフ表示部の処理を説明する図である。
全ての作成対象パターンに対する処理が終了し、変形モデルグラフ生成・登録が終了した後、変形モデルグラフ表示部168は、図8に示すように、指定された文字種(図8では「6」)の変形モデルグラフとして登録された全変形モデルグラフの図と、削除用チェックボックスを表示する。
図8において左から三つ目の変形モデルグラフは、文字種の異なる一文字画像が誤って混在してしまったものであり、また、左から四つ目の変形モデルグラフは、ノイズがのったパターンから生成された変形モデルグラフである。
図9は、接触パターン候補判定部の構成を示す図である。
接触パターン候補判定部18は、変形モデルグラフ読込部181と、サイズ計算部182と、文字線幅推定部183と、細線化部184と、グラフ化部185と、グラフ整形部186と、モデル・マッチング部187と、判定部188とを有している。
文字線幅推定部183は、判定対象パターンの文字線の幅を推定する。
細線化部184、グラフ化部185およびグラフ整形部186は、それぞれ、細線化部164、グラフ化部165およびグラフ整形部166と同様の機能を有している。
グラフ化部185は、細線化したパターンに対し頂点・頂点間の辺を抽出する。そして、抽出した辺および頂点の、接続関係および隣接関係を求めることでグラフ化する。
モデル・マッチング部187は、文字認識結果の一位文字種に対応する変形モデルグラフの全てとグラフ整形部186が整形したグラフとのマッチングを行う。具体的には、グラフ整形部186が整形したグラフと、各々の変形モデルグラフとの類似度を計算し、その中で最大のマッチング度(最大類似度)を求める。
図10は、接触パターン候補判定処理を示すフローチャートである。
まず、変形モデルグラフ読込部181が、文字認識部15による一文字認識結果を受け取る(ステップS1)。
次に、サイズ計算部182、文字線幅推定部183、細線化部184、グラフ化部185、およびグラフ整形部186がそれぞれの処理を行うことにより、判定対象パターンを整形したグラフを生成する(ステップS3)。
次に、判定部188が、得られた最大マッチング度と縦横比とに基づいて判定対象パターンが、接触パターン候補か否かを判定する(ステップS5)。
一方、接触パターン候補ではない場合(ステップS5のNo)、判定対象パターンが一文字候補であると判断する(ステップS6)。
次に、ステップS4におけるモデル・マッチング部187の処理(モデル・マッチング処理)およびステップS5における判定部188の処理(判定処理)を具体的に説明する。
ここでは一例として、Ullmann, "An Algorithm for Subgraph Isomorphism", Journal of the Association for Computing Machinery (1976), Vol. 23, No. 1, pp.31-42に記載されている、部分グラフ同型判定によるマッチングの手法を用いる。この手法は、入力パターンのグラフが、ある変形モデルグラフと同型部分を部分グラフに含むかどうかを調べる手法である。
struct Model_inf {
short modelID; モデル番号
short edgeNo; 辺の数
short vertexNo; 頂点数
short *smatrix; 接続行列ポインタ
short *bmatrix; 隣接行列ポインタ
short category; モデルの属する文字種
};
モデル・マッチング部187は、判定対象パターンから作成されたグラフの頂点隣接行列と、変形モデルグラフの頂点隣接行列とを用いてマッチングを実行する。具体的には、判定対象パターンから作成されたグラフと変形モデルグラフとの同型部分を計算する。そして、マッチングの結果として対応付け行列を得る。
以下、判定対象パターンから作成されたグラフを「G」、判定対象パターンの文字認識結果の一位文字種Cに対する変形モデルグラフ数を「NC」、変形モデルグラフをgC i(i=1、・・・、NC)とする。
図11(a)に示すグラフGの頂点隣接行列Spと図11(b)に示す変形モデルグラフg6 1の頂点隣接行列Smを下式(1)、(2)に示す。
struct Matched_result {
short modelID; モデル番号
short No; マッチング数
short **mmatrix; No個の頂点の対応付け行列
};
次に、モデル・マッチング部187は、得られたマッチング結果に基づいて、文字認識結果の一位文字種のモデルに対する各マッチング度を求め、変形モデルグラフそれぞれのマッチング度の最大値を求める。更に、その最大値が最も大きい変形モデルグラフを求めて、その変形モデルグラフの最大値を最大マッチング度とする。
最大マッチング度を説明するために、「6」の他の変形モデルグラフg6 2を図示している。
グラフGとi番目の変形モデルグラフgC iとのマッチング数がniであったとき、グラフGと変形モデルグラフgC iのk番目の部分グラフ同型のマッチング度を「mCik(k=1、・・・、ni)」とする。
0≦mCik≦1,mCik=−1・・・(8)
ここで、グラフGの各辺の長さは、予め求めてある。また、辺と頂点の接続関係も予め求められている。例えば、頂点V1と頂点V2の間に辺e1があることが予め分かっている。従って、これらの値を代入することにより、マッチング度mCikが求まる。
図13に示すように、辺のラベル毎に長さが格納されている。
図14、図15は、それぞれ、各変形モデルグラフのマッチング度を示す図である。
同様に、変形モデルグラフg6 2が、グラフGの部分グラフとの部分グラフ同型判定の手法を使ったときのマッチング数は7である。従って、マッチング番号(k)毎にマッチした辺の長さを算出する。
また、図15に示す例では、マッチング度MD(G,g6 2)=max{0.27,0.12,0.15,0.12,0.09,0,16,0.09}=0.27となる。
すなわち、argmax={MD(G,g6 1),MD(G,g6 2)}=argmax{0.27,0.67}=2となる。
<判定処理>
判定部188は、モデル・マッチング部187で計算したグラフGに対する文字種Cの変形モデルグラフの最大マッチング度MDC(G)と、サイズ計算部182で計算した対象とするパターンの縦横比Rとに基づいて、接触パターン候補を判定する。
(MDC(G)≦MDth)∧(MDC(G)>0)∨(R>Rth)・・・(12)
判定部188は、最大マッチング度MDC(G)が小さいほど、その認識結果が信用できず接触パターンの可能性が高いと判定する。
なお、上記の処理機能は、コンピュータによって実現することができる。その場合、文字認識装置10が有する機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等が挙げられる。磁気記録装置としては、例えば、ハードディスク装置(HDD)、フレキシブルディスク(FD)、磁気テープ等が挙げられる。光ディスクとしては、例えば、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等が挙げられる。光磁気記録媒体としては、例えば、MO(Magneto-Optical disk)等が挙げられる。
2 比較手段
3 判定手段
4 記憶部
4a、4b、4c、6 構造
5 判定対象パターン
11 2値化部
12 行切り出し部
13 ラベリング部
14 文字認識用辞書格納部
14a、17a データテーブル
15 文字認識部
16 変形モデルグラフ生成部
17 変形モデルグラフ格納部
18 接触パターン候補判定部
19 接触パターンセグメンテーション部
20 出力部
161 文字種指定受付部
162 データ読込部
163 文字線幅推定部
164 細線化部
165 グラフ化部
166 グラフ整形部
167 変形モデルグラフ生成・登録部
168 変形モデルグラフ表示部
169 削除指定受付部
170 不正変形モデルグラフ削除部
181 変形モデルグラフ読込部
182 サイズ計算部
183 文字線幅推定部
184 細線化部
185 グラフ化部
186 グラフ整形部
187 モデル・マッチング部
188 判定部
Claims (5)
- コンピュータに、
一文字であると判定された判定対象パターンから作成した第1のグラフを、記憶部に記憶された一文字パターンから作成した第2のグラフと比較し、前記第1のグラフの頂点間の辺の長さの合計値に対する、前記第1のグラフにおける前記第2のグラフに一致した頂点間の辺の長さの合計値の割合を算出し、
該割合が閾値以下の場合、前記判定対象パターンを複数の文字を含むパターンであると判定する、
処理を実行させることを特徴とする文字認識プログラム。 - 前記第2のグラフの頂点の隣接関係を、前記第1のグラフの頂点の隣接関係に対応付けることにより、前記第1のグラフにおける前記第2のグラフに一致した頂点を判定することを特徴とする請求項1記載の文字認識プログラム。
- 前記コンピュータに、さらに、
前記判定対象パターンの縦横比を求め、
該縦横比と前記割合とに基づいて、前記判定対象パターンが他の文字と接触しているか否かを判定する、
処理を実行させることを特徴とする請求項1または2に記載の文字認識プログラム。 - コンピュータが、
一文字であると判定された判定対象パターンから作成した第1のグラフを、記憶部に記憶された一文字パターンから作成した第2のグラフと比較し、前記第1のグラフの頂点間の辺の長さの合計値に対する、前記第1のグラフにおける前記第2のグラフに一致した頂点間の辺の長さの合計値の割合を算出し、
該割合が閾値以下の場合、前記判定対象パターンを複数の文字を含むパターンであると判定する、
ことを特徴とする文字認識方法。 - 一文字であると判定された判定対象パターンから作成した第1のグラフを、記憶部に記憶された一文字パターンから作成した第2のグラフと比較し、前記第1のグラフの頂点間の辺の長さの合計値に対する、前記第1のグラフにおける前記第2のグラフに一致した頂点間の辺の長さの合計値の割合を算出する比較部と、
該割合が閾値以下の場合、前記判定対象パターンを複数の文字を含むパターンであると判定する判定部と、
を有することを特徴とする文字認識装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009042278A JP5343617B2 (ja) | 2009-02-25 | 2009-02-25 | 文字認識プログラム、文字認識方法および文字認識装置 |
US12/695,351 US8401298B2 (en) | 2009-02-25 | 2010-01-28 | Storage medium storing character recognition program, character recognition method, and character recognition apparatus |
CN201010120503A CN101814141A (zh) | 2009-02-25 | 2010-02-24 | 存储介质、字符识别方法以及字符识别设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009042278A JP5343617B2 (ja) | 2009-02-25 | 2009-02-25 | 文字認識プログラム、文字認識方法および文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010198308A JP2010198308A (ja) | 2010-09-09 |
JP5343617B2 true JP5343617B2 (ja) | 2013-11-13 |
Family
ID=42621392
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009042278A Expired - Fee Related JP5343617B2 (ja) | 2009-02-25 | 2009-02-25 | 文字認識プログラム、文字認識方法および文字認識装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8401298B2 (ja) |
JP (1) | JP5343617B2 (ja) |
CN (1) | CN101814141A (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102385707A (zh) * | 2010-08-30 | 2012-03-21 | 阿里巴巴集团控股有限公司 | 一种数字图像识别的方法、装置及爬虫服务器 |
JP6080586B2 (ja) * | 2013-02-13 | 2017-02-15 | 株式会社ファインデックス | 文字認識システム、文字認識プログラム及び文字認識方法 |
CN104200236B (zh) * | 2014-08-22 | 2018-10-26 | 浙江生辉照明有限公司 | 基于dpm的快速目标检测方法 |
US10438098B2 (en) | 2017-05-19 | 2019-10-08 | Hand Held Products, Inc. | High-speed OCR decode using depleted centerlines |
CN109871847B (zh) * | 2019-03-13 | 2022-09-30 | 厦门商集网络科技有限责任公司 | 一种ocr识别方法及终端 |
CN110851925B (zh) * | 2019-10-31 | 2024-02-20 | 武汉科技大学 | 基于改进邻接矩阵的行星轮系同构判定方法、系统和介质 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5131053A (en) * | 1988-08-10 | 1992-07-14 | Caere Corporation | Optical character recognition method and apparatus |
JPH0337782A (ja) | 1989-07-04 | 1991-02-19 | Mitsubishi Electric Corp | 文字パターン切り出し装置 |
JPH05346974A (ja) * | 1992-06-16 | 1993-12-27 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
JPH06150062A (ja) * | 1992-11-05 | 1994-05-31 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
US5600735A (en) * | 1994-05-10 | 1997-02-04 | Motorola, Inc. | Method of recognizing handwritten input |
JP2630261B2 (ja) | 1994-06-29 | 1997-07-16 | 日本電気株式会社 | 文字認識装置 |
US6104833A (en) * | 1996-01-09 | 2000-08-15 | Fujitsu Limited | Pattern recognizing apparatus and method |
US6111976A (en) * | 1996-11-04 | 2000-08-29 | Rylander; John E. | System and method for handwritten character recognition and qualification |
US6057845A (en) * | 1997-11-14 | 2000-05-02 | Sensiva, Inc. | System, method, and apparatus for generation and recognizing universal commands |
SE514377C2 (sv) | 1998-08-26 | 2001-02-19 | Gunnar Sparr | Teckenigenkänning |
EP1052593B1 (en) * | 1999-05-13 | 2015-07-15 | Canon Kabushiki Kaisha | Form search apparatus and method |
JP3798179B2 (ja) * | 1999-05-14 | 2006-07-19 | 富士通株式会社 | パターン抽出装置及び文字切り出し装置 |
JP2002063385A (ja) * | 2000-08-22 | 2002-02-28 | Sony Corp | 情報処理装置および方法、並びに記録媒体 |
JP4543675B2 (ja) * | 2003-12-22 | 2010-09-15 | パナソニック電工株式会社 | 文字・図形の認識方法 |
-
2009
- 2009-02-25 JP JP2009042278A patent/JP5343617B2/ja not_active Expired - Fee Related
-
2010
- 2010-01-28 US US12/695,351 patent/US8401298B2/en active Active
- 2010-02-24 CN CN201010120503A patent/CN101814141A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
US20100215276A1 (en) | 2010-08-26 |
JP2010198308A (ja) | 2010-09-09 |
CN101814141A (zh) | 2010-08-25 |
US8401298B2 (en) | 2013-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10685462B2 (en) | Automatic data extraction from a digital image | |
JP3822277B2 (ja) | 文字テンプレートセット学習マシン動作方法 | |
Dalitz et al. | A comparative study of staff removal algorithms | |
WO2018108129A1 (zh) | 用于识别物体类别的方法及装置、电子设备 | |
US7792369B2 (en) | Form processing method, form processing device, and computer product | |
JP5031741B2 (ja) | 文書視覚構造の文法的な解析 | |
Mahmoud | Recognition of writer-independent off-line handwritten Arabic (Indian) numerals using hidden Markov models | |
JP5343617B2 (ja) | 文字認識プログラム、文字認識方法および文字認識装置 | |
JP2004139484A (ja) | 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム | |
WO2018003153A1 (ja) | 認識装置及び認識方法 | |
JPS61267177A (ja) | 文書画像追加情報の蓄積方法 | |
Madhvanath et al. | Syntactic methodology of pruning large lexicons in cursive script recognition | |
Mohammad et al. | Contour-based character segmentation for printed Arabic text with diacritics | |
WO2021131324A1 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
CN110826488B (zh) | 一种针对电子文档的图像识别方法、装置及存储设备 | |
Lee et al. | Deep learning-based digitalization of a part catalog book to generate part specification by a neutral reference data dictionary | |
Suwanwiwat et al. | Benchmarked multi-script Thai scene text dataset and its multi-class detection solution | |
Tehsin et al. | A caption text detection method from images/videos for efficient indexing and retrieval of multimedia data | |
Pham et al. | A deep learning approach for text segmentation in document analysis | |
JP2023003887A (ja) | 書類画像処理システム、書類画像処理方法、および書類画像処理プログラム | |
Delalandre et al. | Performance evaluation of symbol recognition and spotting systems: An overview | |
Widiarti et al. | Clustering Balinese Script Image in Palm Leaf Using Hierarchical K-Means Algorithm | |
JP6511942B2 (ja) | 情報処理装置および情報処理プログラム | |
Bogacz | Analyzing handwritten and transcribed symbols in disparate corpora | |
Liu et al. | Table detection method based on feature pyramid network with faster R-CNN |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111006 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130312 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130319 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130509 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130716 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130729 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5343617 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |