JP5343617B2 - 文字認識プログラム、文字認識方法および文字認識装置 - Google Patents

文字認識プログラム、文字認識方法および文字認識装置 Download PDF

Info

Publication number
JP5343617B2
JP5343617B2 JP2009042278A JP2009042278A JP5343617B2 JP 5343617 B2 JP5343617 B2 JP 5343617B2 JP 2009042278 A JP2009042278 A JP 2009042278A JP 2009042278 A JP2009042278 A JP 2009042278A JP 5343617 B2 JP5343617 B2 JP 5343617B2
Authority
JP
Japan
Prior art keywords
graph
character
unit
pattern
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009042278A
Other languages
English (en)
Other versions
JP2010198308A (ja
Inventor
美佐子 諏訪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2009042278A priority Critical patent/JP5343617B2/ja
Priority to US12/695,351 priority patent/US8401298B2/en
Priority to CN201010120503A priority patent/CN101814141A/zh
Publication of JP2010198308A publication Critical patent/JP2010198308A/ja
Application granted granted Critical
Publication of JP5343617B2 publication Critical patent/JP5343617B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/19007Matching; Proximity measures
    • G06V30/19013Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • G06V30/1902Shifting or otherwise transforming the patterns to accommodate for positional errors
    • G06V30/1904Shifting or otherwise transforming the patterns to accommodate for positional errors involving a deformation of the sample or reference pattern; Elastic matching
    • G06V30/19047Shifting or otherwise transforming the patterns to accommodate for positional errors involving a deformation of the sample or reference pattern; Elastic matching based on a local optimisation criterion, e.g. "snakes", i.e. active contour models of the pattern to be recognised
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Description

本発明は文字認識プログラム、文字認識方法および文字認識装置に関する。
手書き文字や印字された文字を光学的に読み取り、予め記憶されたパターンと照合することにより、読み取った文字を特定させるOCR(Optical Character Reader)機能が知られている。
読み取り対象となる文字列には、他の文字と接触している接触文字と、一文字である孤立文字とが混在している場合がある。
一般的なOCR機能は、認識の効率を向上させるためや、文字の切り出し候補の増大による切り出し誤りの発生を回避するために、他の文字と接触している可能性のある接触パターンと一文字である可能性の高い孤立文字パターンとを判定する機能を所持する。
孤立文字パターンと判定された候補(孤立文字パターン候補)に対しては、そのまま一文字認識が実行される。
一方、接触パターンと判定された候補(接触パターン候補)に対しては、セグメンテーション(切り出しおよび認識)が行われる。
接触パターン候補を判定する方法としては、例えば、判定対象とするパターンの文字列方向の長さが閾値以上のものを接触パターン候補と判定する方法や、パターンの幅をW、高さをH、定数をKとしたときW/H>K(横書きの場合)の場合を接触パターン候補と判定する方法等が知られている。
特開平3−37782号公報 特開平8−16720号公報
前述した方法は、接触パターンは孤立文字パターンと比較して文字列方向の長さが一般的に大きくなっているという性質を利用している。
しかしながら、接触パターンであっても文字列方向の長さや、パターンの縦横比(W/H)では孤立文字パターンと区別できないケースが存在し、接触パターン候補の判定漏れを起こして文字認識誤りの一因となっている。
これらの判定漏れに対して閾値を下げれば、ある程度、接触パターン候補であるとの判定が可能であるが、接触パターン候補の数がその分増加する。このため、切り出す文字の数が増大して誤ったセグメンテーション結果を選択してしまう場合がある。
本発明はこのような点に鑑みてなされたものであり、文字の接触パターンを精度よく判定する文字認識プログラム、文字認識方法および文字認識装置を提供することを目的とする。
上記目的を達成するために、文字認識プログラムが提供される。この文字認識プログラムは、コンピュータに、比較手順および判定手順を実行させる。
比較手順は、一文字であると判定された判定対象パターンの構造を、記憶部に記憶された一文字パターンの構造と比較する。
判定手順は、比較手順の比較結果に基づいて、判定対象パターンが複数の文字を含むパターンか否かを判定する。
このような文字認識プログラムによれば、比較手順により、一文字であると判定された判定対象パターンの構造が、記憶部に記憶された一文字パターンの構造と比較される。判定手順により、比較手順の比較結果に基づいて、判定対象パターンが複数の文字を含むパターンか否かが判定される。
開示の文字認識プログラムによれば、文字の接触パターンを精度よく判定することができる。
実施の形態の文字認識装置の概要を示す図である。 文字認識装置のハードウェア構成例を示す図である。 文字認識装置の機能を示すブロック図である。 文字認識辞書のデータ構成を示す図である。 変形モデルグラフのデータ構成を示す図である。 変形モデルグラフ生成部の構成を示す図である。 グラフの整形を説明する図である。 変形モデルグラフ表示部の処理を説明する図である。 接触パターン候補判定部の構成を示す図である。 接触パターン候補判定処理を示すフローチャートである。 マッチングを実行したときの例を示す図である。 最大マッチング度を説明する図である。 グラフの各辺の長さを示す図である。 変形モデルグラフのマッチング度を示す図である。 変形モデルグラフのマッチング度を示す図である。
以下、実施の形態を、図面を参照して詳細に説明する。
まず、実施の形態の文字認識装置について説明し、その後、実施の形態をより具体的に説明する。
図1は、実施の形態の文字認識装置の概要を示す図である。
文字認識装置(コンピュータ)1は、比較手段2および判定手段3として機能する。
比較手段2は、一文字であると判定された判定対象パターンの構造を、記憶部4に記憶された一文字パターンの構造と比較する。この一文字パターンの構造は、判定対象パターンが一文字である場合にその文字を識別するために予め用意されたパターンの構造である。また、記憶部4は、文字認識装置1内に設けられていてもよいし、文字認識装置1の外部に設けられていてもよい。
図1では、例えば、一文字枠が印刷されていない枠なし領域に自由に記入された、手書き数字「6」に数字「2」が接触した判定対象パターン5が図示されている。
この判定対象パターン5は、数字「6」に数字「2」が接触したパターンであるにもかかわらず、一文字であると判定されたパターンである。この判定対象パターン5が、後述するルールにより整形され、頂点と辺とを有する構造6になっている。
図1では、記憶部4には、数字が「6」であることを識別する三つ(複数)の一文字パターンの構造4a、4b、4cが記憶されている。
比較手段2は、構造6を、一文字パターンの構造4a、4b、4cとそれぞれ比較する。例えば、構造6が、構造4a、4b、4cと同型部分を含むか否かを比較する。
図1では、構造6が、構造4bと同型部分を含んでいるか否かを比較している。そして、構造6に一致する構造4bの割合を類似度として算出する。
判定手段3は、比較手段2の比較結果に基づいて、判定対象パターンを一文字であるか否かを判定する。
図1では、比較手段2の比較結果である類似度「0.67」に加え、サイズ情報(パターンの高さに対する幅の比)を用いて判定対象パターン5が一文字であるか否かを判定する。例えば、類似度「0.67」が予め定められた閾値以上であり、かつ、前述した比が
予め定められた閾値以上である場合に、判定対象パターン5が一文字であると判定する。一方、そうでなければ、接触パターンであると判定する。
図1では、判定対象パターン5が接触パターンであると判定されている。
このような文字認識装置1によれば、構造を比較することで、文字の接触パターンを精度よく判定することができる。
以下、実施の形態をより具体的に説明する。
図2は、文字認識装置のハードウェア構成例を示す図である。
文字認識装置10は、CPU(Central Processing Unit)101によって装置全体が制御されている。CPU101には、バス109を介してRAM(Random Access Memory)102、ハードディスクドライブ(HDD:Hard Disk Drive)103、グラフィック処理装置104、入力インタフェース105、106、外部補助記憶装置107、および通信インタフェース108が接続されている。
RAM102には、CPU101に実行させるOS(Operating System)のプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、RAM102には、CPU101による処理に必要な各種データが格納される。HDD103には、OSやアプリケーションプログラムが格納される。また、HDD103内には、プログラムファイルが格納される。
グラフィック処理装置104には、モニタ104aが接続されている。グラフィック処理装置104は、CPU101からの命令に従って、画像をモニタ104aの画面に表示させる。入力インタフェース105には、キーボード105aとマウス105bとが接続されている。入力インタフェース105は、キーボード105aやマウス105bから送られてくる信号を、バス109を介してCPU101に送信する。
入力インタフェース106は、イメージスキャナ106aに接続されている。入力インタフェース106は、イメージスキャナ106aから送られてくる信号(例えば帳票画像を電子データに変換した画像信号)を、バス109を介してCPU101に送信する。
外部補助記憶装置107は、記録媒体に書き込まれた情報を読み取ったり、記録媒体に情報を書き込んだりする。外部補助記憶装置107で読み書きが可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等が挙げられる。磁気記録装置としては、例えば、HDD、フレキシブルディスク(FD)、磁気テープ等が挙げられる。光ディスクとしては、例えば、DVD(Digital Versatile Disc)、DVD−RAM、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等が挙げられる。光磁気記録媒体としては、例えば、MO(Magneto-Optical disk)等が挙げられる。
通信インタフェース108は、ネットワーク30に接続されている。通信インタフェース108は、ネットワーク30を介して、他のコンピュータとの間でデータの送受信を行う。
以上のようなハードウェア構成によって、本実施の形態の処理機能を実現することができる。このようなハードウェア構成の文字認識装置10内には、以下のような機能が設けられる。
図3は、文字認識装置の機能を示すブロック図である。
文字認識装置10は、2値化部11と、行切り出し部12と、ラベリング部13と、文字認識用辞書格納部14と、文字認識部15と、変形モデルグラフ生成部16と、変形モデルグラフ格納部17と、接触パターン候補判定部18と、接触パターンセグメンテーション部19と、出力部20とを有している。
2値化部11は、イメージスキャナ106aが帳票画像を電子データに変換した画像を2値化する。
行切り出し部12は、2値化部11によって2値化された帳票画像から文字の行(文字行)を切り出す。以下、切り出された文字行に含まれる文字のパターンを「判定対象パターン」と言う。
ラベリング部13は、判定対象パターン内の異なる連結成分をラベル(番号)付けする。このとき、必要があれば、連結成分の外接矩形の重なりを調べてラベルを統合する。
文字認識用辞書格納部14は、文字認識に使用する文字認識用辞書を格納している。
文字認識部15は、文字認識用辞書格納部14に格納されている文字認識用辞書を読み込み、各ラベルに対応する判定対象パターンに対して文字認識を実行する。
変形モデルグラフ生成部16は、接触パターン候補判定に使用する文字種毎の変形モデルグラフを生成し、変形モデルグラフ格納部17に格納する。なお、変形モデルグラフおよびその生成方法については、後に詳述する。
接触パターン候補判定部18は、文字認識部15が実行した文字認識により得られた判定対象パターンの文字認識結果に対し、変形モデルグラフ格納部17に格納されている変形モデルグラフを使用して、判定対象パターンが接触パターン候補か否かを判定する。
接触パターンセグメンテーション部19は、接触パターン候補と判定された判定対象パターンに対しては接触箇所を判定して切り出し・認識結果を求める。
出力部20は、判定対象パターンの文字認識結果をモニタ104aに出力する。
次に、文字認識用辞書格納部14に格納されている文字認識辞書のデータ構成を説明する。
図4は、文字認識辞書のデータ構成を示す図である。
データがテーブル化されて格納されている。
データテーブル14aは、文字種毎に、変形モデルグラフの数が設定されている。そして、変形モデルグラフ毎に、変形モデルグラフを識別する番号が付されており、変形モデルグラフ毎に、モデルの頂点数、モデルの辺数、モデルの頂点隣接行列、モデルの頂点と辺の接続行列が設定されている。
ここで、モデルの頂点隣接行列は、頂点間の隣接関係を「1」と「0」で表す行列であり、例えば、頂点数が「n」のときn行n列の行列である。
また、モデルの頂点と辺の接続行列は、頂点と辺の接続関係を「0」と「1」で表す行列であり、例えば、頂点数が「n」で辺数が「m」のとき、n行m列の行列である。
次に、変形モデルグラフ格納部17に格納されている変形モデルグラフのデータ構成を説明する。
図5は、変形モデルグラフのデータ構成を示す図である。
データテーブル17aは、文字種毎に、テンプレート(辞書)の数を示すテンプレート数が設定されている。そして、テンプレート毎に、ベクトルの成分を識別する情報が設定されている。
次に、変形モデルグラフ生成部16の構成を詳しく説明する。
図6は、変形モデルグラフ生成部の構成を示す図である。
変形モデルグラフ生成部16は、文字種指定受付部161と、データ読込部162と、文字線幅推定部163と、細線化部164と、グラフ化部165と、グラフ整形部166と、変形モデルグラフ生成・登録部167と、変形モデルグラフ表示部168と、削除指定受付部169と、不正変形モデルグラフ削除部170とを有している。
文字種指定受付部161は、変形モデルグラフを作成したい文字種の、ユーザによる指定(入力)を受け付ける。
データ読込部162は、文字種指定受付部161が受け付けた文字種の2値の学習用の一文字画像データを、例えば、予め用意されたデータベースから読み込む。以下、一文字画像データに含まれる文字のパターンを「一文字パターン」と言う。
文字線幅推定部163は、一文字パターンの文字線の幅を推定する。
細線化部164は、一文字パターンを細線化する。
グラフ化部165は、細線化部164が細線化した一文字パターンに対し、頂点と、頂点間の辺とを抽出する。そして抽出した辺および頂点の、接続関係および隣接関係を求めることで一文字パターンをグラフ化する。
グラフ整形部166は、各文字種の変形モデルグラフ数の増大とそれによるマッチング回数の増大を防ぐため、グラフ化部165によってグラフ化されたグラフを一定のルールで整形する。
変形モデルグラフ生成・登録部167は、一つ目の一文字パターンに対応するグラフを無条件に変形モデルグラフとして登録し、二つ目以降の一文字パターンに対応するグラフについては、登録済みの変形モデルグラフの全てとのマッチングを行う。そして、マッチング条件に合わない場合は、異なる変形であるとして新たな変形モデルグラフとして登録する。なお、この処理については、後に詳述する。
変形モデルグラフ表示部168は、指定文字種の変形モデルグラフとして登録された全変形モデルグラフ図と各変形モデルグラフ図の近傍に削除用チェックボックスを表示する。
削除指定受付部169は、マウス105b等を使ったユーザによるチェックボックスへのチェックによって指定される削除情報を受け付ける。
不正変形モデルグラフ削除部170は、削除指定受付部169が受け付けた削除情報に基づいて、削除指定された変形モデルグラフに対応するデータを登録された変形モデルグラフデータから削除する。また、残っている変形モデルグラフのモデル番号を修正する。
次に、変形モデルグラフ生成部16の処理について詳しく説明する。
<グラフ化部>
グラフ化部165は、細線化部164で得られた細線化された一文字パターンを、グラフで表現する。具体的には、まず、細線化された一文字パターンから頂点座標と次数を求める。次に、頂点間の辺を追跡し、辺の各点の座標、辺の長さ、接続する頂点番号を求める。また、各頂点に接続する辺の番号を求める。
これらの辺と頂点情報を使って、頂点隣接行列を計算する。隣接行列は、頂点数×頂点数の行列であり、頂点間が辺で結ばれていれば「1」、結ばれていなければ「0」の値を持つ。これらは、グラフ理論の一般的な定義に等しい。
グラフ化部165は、具体的に以下のようなデータを計算し、得られたデータをそれぞれに用意されている構造体に格納する。
(1)グラフ情報
グラフを構成する辺・頂点の数、頂点隣接行列、辺と頂点の接続行列を計算し、グラフ情報構造体に格納する。
(2)辺情報
各辺の、長さ、接続する2頂点の番号、辺の軌跡の座標を計算し、辺情報構造体に格納する。
(3)頂点情報
各頂点の、座標、次数、接続する辺の番号を計算し、頂点情報構造体に格納する。
この構造体は、例えば、次のような構造でもよい。
<辺情報構造体>
struct Edge_inf{
short *vertexNo; 接続する頂点番号配列
short *xcood; 辺の各点(軌跡)のx座標配列ポインタ
short *ycood; 辺の各点(軌跡)のy座標配列ポインタ
short length; 辺の長さ
short vn1, vn2; 辺に接続する2頂点の番号
};
<頂点情報構造体>
struct Vertex_inf{
short x, y; 頂点座標のx、y座標
short degree; 頂点の次数
short *edgeNo; 接続する辺番号配列ポインタ
short counter; 辺追跡時のカウンタ
};
<グラフ情報構造体>
struct Graph_inf{
struct Edge_inf *edge; 辺情報構造体ポインタ
short edgeNo; 辺の数
struct Vertex_inf *vertex; 頂点情報構造体ポインタ
short vertexNo; 頂点数
short *smatrix; 接続行列ポインタ
short *bmatrix; 隣接行列ポインタ
};
<グラフ整形部>
グラフ整形部166は、一文字パターンから得られたグラフを整形する。
グラフの整形は、Vilatov, Gitis, and Kil, “Graph-based Handwritten Digit String Recognition”(1995), Proc. of ICDAR, pp. 845-848の5.1に記述されているグラフ変形の手法を参考にしている。グラフのループに次数2の頂点を追加する部分が、上記文献の手法とは異なる。
整形のルールは以下の通りである。
図7は、グラフの整形を説明する図である。
グラフ整形部166は、グラフ化部165が求めた辺・頂点の構造体を削除・分割・追加する処理を行い、隣接行列・接続行列を再計算する。
具体的には、まず、図7(a)に示すように、細線化部164が施した処理の結果、文字線の凹凸により一文字パターンのグラフに突起(ヒゲ)が生じることがあるため、この突起を削除する必要がある。
具体的には、一文字パターンのグラフから、一定長さ以下の辺で、次数(degree)が「1」の頂点(端点)に接続する辺を全て削除する。ここでは、予め計算しておいた文字線幅程度とする。
図7(b)に示す例では、辺e3が削除対象に該当する、この辺e3は、次数が「3」の頂点v2と次数が「1」の頂点v3とに接続している。
この場合、次数が「1」の頂点v3を削除する。頂点v3を削除した後、次数が「1」でない方の頂点の次数を「1」減らす。すなわち、図7(c)に示すように、辺e3に対応する辺情報構造体を除き、頂点v2に対応する頂点情報構造体のメンバーの次数を「3」から「2」にする。更に、接続する辺番号配列から削除した辺番号を除く。これは、接続する辺の数が減るためである。
次に、一文字パターンのグラフから、前述の処理で発生した次数が「2」の頂点を全て除く。
図7(d)に示す例では、頂点v2を除き、辺e2と辺e4とを統合し辺e2とする。すなわち、頂点v2に対応する頂点情報構造体構造体を除き、辺e2と辺e4の辺情報構造体を統合して一つにする。
次に、2頂点に接続する辺が必ず一つとなるよう、ループの部分に次数が「2」の頂点を2個任意の位置に追加する。よって、ループの部分の辺は三つに分割される。
図7(e)に示す例では、ループに次数が「2」の頂点v2、v3を付加し、辺e1を辺e1a、e3、e4に分割する。すなわち、頂点v2、v3に対応する頂点情報構造体を作成し、その位置座標を辺e1の辺情報構造体の辺の各点の任意の2点とする。これによって、辺e1に対応する辺情報構造体を三つに分割し、辺e1a、e3、e4に対応する辺情報構造体を作成する。
最後に、得られた辺情報構造体、頂点情報構造体から、隣接行列、接続行列を再計算する。
次に、変形モデルグラフ生成・登録部167の処理を詳しく説明する。
<変形モデルグラフ生成・登録部>
変形モデルグラフ生成・登録部167は、整形されたグラフの最初(1番目)の作成対象パターンにおいては、無条件に、その文字種の変形モデルグラフとして登録し、対象文字種の変形モデルグラフの数を「1」とする。
2番目以降の作成対象パターンは、グラフ整形までは1番目の作成対象パターンと同様の処理を行う。ただし、変形モデルグラフ生成・登録部167では登録済みの変形モデルグラフと、2番目以降の作成対象パターンのグラフとの同型判定を行い、同型でないものを新たな変形モデルグラフとして登録し、変形モデルグラフ数を「1」増加させる。なお、同型とは、変形モデルグラフと作成対象パターンのグラフとが完全に一致する場合である。
<変形モデルグラフ表示部>
図8は、変形モデルグラフ表示部の処理を説明する図である。
全ての作成対象パターンに対する処理が終了し、変形モデルグラフ生成・登録が終了した後、変形モデルグラフ表示部168は、図8に示すように、指定された文字種(図8では「6」)の変形モデルグラフとして登録された全変形モデルグラフの図と、削除用チェックボックスを表示する。
これは、汚れ等のノイズを有するパターンが学習用の作成対象パターンに混在している場合や、他の文字種のパターンが誤って混在している場合等は、不正な変形モデルグラフが生成されるため、これを除く必要があるからである。
前述したように、削除指定受付部169は、ユーザのマウス105b等の操作により、不正な変形モデルグラフの削除用チェックボックスへのチェックを受け付けると、その変形モデルグラフを削除対象に指定する。
不正変形モデルグラフ削除部170は、削除対象に指定された変形モデルグラフに対応するデータを、変形モデルグラフ生成・登録部167が登録した変形モデルグラフから削除し、同時に残っている変形モデルグラフのモデル番号を修正する。
図8では、変形モデルグラフ生成・登録部167が、文字種「6」について四つの変形モデルグラフを生成した場合を図示している。
図8において左から三つ目の変形モデルグラフは、文字種の異なる一文字画像が誤って混在してしまったものであり、また、左から四つ目の変形モデルグラフは、ノイズがのったパターンから生成された変形モデルグラフである。
ユーザの操作により、三つ目、四つ目の変形モデルグラフのチェックボックスへのチェックを受け付けると、変形モデルグラフ生成・登録部167が登録した変形モデルグラフから対応する変形モデルグラフが削除される。この結果、一つ目、二つ目の変形モデルグラフが、文字種「6」の変形モデルグラフとして決定される。なお、図1に示す一文字パターンの構造4a、4b、4cは、削除されて残った変形モデルグラフに対応する。
次に、接触パターン候補判定部18の構成を説明する。
図9は、接触パターン候補判定部の構成を示す図である。
接触パターン候補判定部18は、変形モデルグラフ読込部181と、サイズ計算部182と、文字線幅推定部183と、細線化部184と、グラフ化部185と、グラフ整形部186と、モデル・マッチング部187と、判定部188とを有している。
変形モデルグラフ読込部181は、文字認識結果の一位文字種(最も可能性が高いと判断された文字種)に対応した変形モデルグラフを読み込む。例えば、文字認識結果の一位文字種が「6」であれば、「6」の変形モデルグラフを読み込む。
サイズ計算部182は、判定対象パターンの幅・高さ・縦横比を求める。
文字線幅推定部183は、判定対象パターンの文字線の幅を推定する。
細線化部184、グラフ化部185およびグラフ整形部186は、それぞれ、細線化部164、グラフ化部165およびグラフ整形部166と同様の機能を有している。
すなわち、細線化部184は、判定対象パターンを細線化する。
グラフ化部185は、細線化したパターンに対し頂点・頂点間の辺を抽出する。そして、抽出した辺および頂点の、接続関係および隣接関係を求めることでグラフ化する。
グラフ整形部186は、グラフ化部185がグラフ化したグラフを一定のルールで整形する。
モデル・マッチング部187は、文字認識結果の一位文字種に対応する変形モデルグラフの全てとグラフ整形部186が整形したグラフとのマッチングを行う。具体的には、グラフ整形部186が整形したグラフと、各々の変形モデルグラフとの類似度を計算し、その中で最大のマッチング度(最大類似度)を求める。
判定部188は、モデル・マッチング部187で計算した変形モデルグラフのマッチング度と、サイズ計算部182で計算した判定対象パターンの縦横比とに基づいて、判定対象パターンが、接触パターン候補か否かを判定する。
次に、接触パターン候補判定部18の処理(接触パターン候補判定処理)を説明する。
図10は、接触パターン候補判定処理を示すフローチャートである。
まず、変形モデルグラフ読込部181が、文字認識部15による一文字認識結果を受け取る(ステップS1)。
次に、変形モデルグラフ読込部181が、変形モデルグラフ格納部17から文字認識結果の一位文字種に対応した変形モデルグラフを読み込む(ステップS2)。
次に、サイズ計算部182、文字線幅推定部183、細線化部184、グラフ化部185、およびグラフ整形部186がそれぞれの処理を行うことにより、判定対象パターンを整形したグラフを生成する(ステップS3)。
次に、モデル・マッチング部187が、最大マッチング度を計算する(ステップS4)。
次に、判定部188が、得られた最大マッチング度と縦横比とに基づいて判定対象パターンが、接触パターン候補か否かを判定する(ステップS5)。
接触パターン候補である場合(ステップS5のYes)、判定対象パターンが接触パターン候補であると判断する(ステップS6)。
一方、接触パターン候補ではない場合(ステップS5のNo)、判定対象パターンが一文字候補であると判断する(ステップS6)。
以上で、接触パターン候補判定処理の説明を終了する。
次に、ステップS4におけるモデル・マッチング部187の処理(モデル・マッチング処理)およびステップS5における判定部188の処理(判定処理)を具体的に説明する。
<モデル・マッチング処理>
ここでは一例として、Ullmann, "An Algorithm for Subgraph Isomorphism", Journal of the Association for Computing Machinery (1976), Vol. 23, No. 1, pp.31-42に記載されている、部分グラフ同型判定によるマッチングの手法を用いる。この手法は、入力パターンのグラフが、ある変形モデルグラフと同型部分を部分グラフに含むかどうかを調べる手法である。
モデルグラフの構築には様々な手法があるが、本実施の形態では、一つの変形モデルグラフは、次に示す情報から構成される。すなわち、モデル番号、モデルの持つ辺の数、モデルの持つ頂点数、モデルの頂点接続行列、モデルの頂点と辺の隣接行列、モデルの属する文字種である。この変形モデルグラフとして、例えば、以下の構造体struct Model_infに示す隣接関係のみの情報を持つグラフを使用してもよい。
struct Model_inf {
short modelID; モデル番号
short edgeNo; 辺の数
short vertexNo; 頂点数
short *smatrix; 接続行列ポインタ
short *bmatrix; 隣接行列ポインタ
short category; モデルの属する文字種
};
モデル・マッチング部187は、判定対象パターンから作成されたグラフの頂点隣接行列と、変形モデルグラフの頂点隣接行列とを用いてマッチングを実行する。具体的には、判定対象パターンから作成されたグラフと変形モデルグラフとの同型部分を計算する。そして、マッチングの結果として対応付け行列を得る。
ここで、一つの変形モデルグラフは、判定対象パターンから作成されたグラフの複数の部分と同型となることがある。よって、マッチングの結果は、対象とする変形モデルグラフのモデル番号、マッチした数を示すマッチング数、および、判定対象パターンから作成されたグラフにマッチした変形モデルグラフの頂点の対応付け行列となる。
図11は、マッチングを実行したときの例を示す図である。
以下、判定対象パターンから作成されたグラフを「G」、判定対象パターンの文字認識結果の一位文字種Cに対する変形モデルグラフ数を「NC」、変形モデルグラフをgC i(i=1、・・・、NC)とする。
図11では、グラフGを判定対象パターンの文字認識結果の一位文字種Cが「6」の変形モデルグラフと比較している。
図11(a)に示すグラフGの頂点隣接行列Spと図11(b)に示す変形モデルグラフg6 1の頂点隣接行列Smを下式(1)、(2)に示す。
Figure 0005343617
Figure 0005343617
頂点隣接行列Spのサイズは、グラフGの頂点数×頂点数となっており、頂点隣接行列Smのサイズは、変形モデルグラフg6 1の頂点数×頂点数となっている。また、各行列の値は、頂点間が辺で結ばれている場合は「1」をとり、そうでない場合は「0」をとる。例えば、図11に示すグラフGの頂点v1(1行目)は、頂点v2にのみ辺で結ばれているため、2列目だけが「1」であり、それ以外の列は「0」である。また、頂点v2(2行目)は、頂点v1、v3、v5に辺で結ばれているため、1列目、3列目、5列目が「1」であり、それ以外の列は「0」である。
対応付け行列は、行数が変形モデルグラフの頂点数、列数が対象のグラフの頂点数に対応する。頂点間が対応付けられるときは「1」を、対応付けられないときは「0」を表す行列である。
図11(a)に示すグラフGと、図11(b)に示す変形モデルグラフg6 1との部分グラフ同型判定を行った結果、図11(c)に示すマッチング結果が得られる。図11(c)中、太い辺が変形モデルグラフg6 1とマッチした部分である。
図11(c)は、頂点V1が、頂点v1に対応し、頂点V2が、頂点v2に対応し、頂点V3が、頂点v3に対応し、頂点V4が、頂点v5に対応しているマッチング結果を示している。
図11には図示していないが、頂点V1が、頂点v1に対応し、頂点V2が、頂点v2に対応し、頂点V3が、頂点v5に対応し、頂点V4が、頂点v3に対応しているマッチング結果も得られる。
同様に、図11(c)は、頂点V1が、頂点v6に対応し、頂点V2が、頂点v5に対応し、頂点V3が、頂点v2に対応し、頂点V4が、頂点v3に対応しているマッチング結果を示している。
図11には図示していないが、頂点V1が、頂点v6に対応し、頂点V2が、頂点v5に対応し、頂点V3が、頂点v3に対応し、頂点V4が、頂点v2に対応しているマッチング結果も得られる。
このように、図11に示す例ではマッチング数は「4」となる。この結果得られる対応付け行列M1〜M4を式(3)〜式(6)に示す。行列M1は、1番目(k=1)の部分グラフ同型判定により得られたマッチング結果の対応付け行列である。行列M2は、2番目(k=2)の部分グラフ同型判定により得られたマッチング結果の対応付け行列である。行列M3は、3番目(k=3)の部分グラフ同型判定により得られたマッチング結果の対応付け行列である。行列M4は、4番目(k=4)の部分グラフ同型判定により得られたマッチング結果の対応付け行列である。
Figure 0005343617
Figure 0005343617
Figure 0005343617
Figure 0005343617
マッチング結果、すなわち、マッチしたモデル番号、マッチング数、マッチング数個の頂点対応付け行列は、それぞれマッチング結果用構造体に格納される。このマッチング結果用構造体としては、例えば、次のstruct Matched_resultに示す構造体に格納してもよい。
struct Matched_result {
short modelID; モデル番号
short No; マッチング数
short **mmatrix; No個の頂点の対応付け行列
};
次に、モデル・マッチング部187は、得られたマッチング結果に基づいて、文字認識結果の一位文字種のモデルに対する各マッチング度を求め、変形モデルグラフそれぞれのマッチング度の最大値を求める。更に、その最大値が最も大きい変形モデルグラフを求めて、その変形モデルグラフの最大値を最大マッチング度とする。
図12は、最大マッチング度を説明する図である。
最大マッチング度を説明するために、「6」の他の変形モデルグラフg6 2を図示している。
まず、文字認識結果の一位文字種のモデルに対する各マッチング度を求める処理を説明する。
グラフGとi番目の変形モデルグラフgC iとのマッチング数がniであったとき、グラフGと変形モデルグラフgC iのk番目の部分グラフ同型のマッチング度を「mCik(k=1、・・・、ni)」とする。
マッチング度mCikは、グラフGの持つ辺か頂点の数が、文字種Cのi番目の変形モデルグラフgC iの持つ辺または頂点の数より小さい場合は「−1」、そうでない場合は、グラフGの各辺の長さの総和に対し、文字種Cのi番目の変形モデルグラフgC iのk番目の部分グラフ同型でマッチングした辺の長さの和の比で定義する。
よって、変形モデルグラフgC iとマッチしたk番目の部分グラフ同型に対応する辺の長さの総和を「lik」、グラフGの辺の長さの総和を「L」とすると、下式(7)、(8)に示す関係となる。
Cik=lik/L・・・(7)
0≦mCik≦1,mCik=−1・・・(8)
ここで、グラフGの各辺の長さは、予め求めてある。また、辺と頂点の接続関係も予め求められている。例えば、頂点V1と頂点V2の間に辺e1があることが予め分かっている。従って、これらの値を代入することにより、マッチング度mCikが求まる。
図13は、グラフの各辺の長さを示す図である。
図13に示すように、辺のラベル毎に長さが格納されている。
図14、図15は、それぞれ、各変形モデルグラフのマッチング度を示す図である。
前述したように、変形モデルグラフg6 1が、グラフGの部分グラフとの部分グラフ同型判定の手法を使ったときのマッチング数は「4」である。従って、マッチング番号(k)毎にマッチした辺の長さを算出する。
例えば、対応付け行列M1より、対応付けられた頂点は、頂点v1、v2、v3、v5であることが分かる。従って、マッチした辺の長さの総和l11は、頂点v1、v2間の辺e1、頂点v2、v3間の辺e2、頂点v3、v5間の辺e3、および、頂点v5、v2間の辺e4の和(=54)となる。
マッチング度m611は、l1k/L=54/(22+10+12+10+7+13+7)=0.67となる。
同様に、変形モデルグラフg6 2が、グラフGの部分グラフとの部分グラフ同型判定の手法を使ったときのマッチング数は7である。従って、マッチング番号(k)毎にマッチした辺の長さを算出する。
そして、マッチング度mCikの最大のものを、グラフGと変形モデルグラフgC iのマッチング度MD(G,gC i)と定義する。全ての変形モデルグラフgC i(i=1、・・・、NC)に対し、マッチング度MD(G,gC i)を求め、その最大値をグラフGに対する文字種Cの変形モデルグラフの最大マッチング度MDC(G)とする。式で表すと下式(9)〜(11)のようになる。
Figure 0005343617
Figure 0005343617
Figure 0005343617
図14に示す例では、マッチング度MD(G,g6 1)=max{0.67,0.67,0.48,0.48}=0.67となる。
また、図15に示す例では、マッチング度MD(G,g6 2)=max{0.27,0.12,0.15,0.12,0.09,0,16,0.09}=0.27となる。
次に、それらの最大値の中から最大を与えるモデル番号を求める。求めたマッチング度0.67と0.27とを比較すると0.67が大きいので、モデル番号は「2」となる。
すなわち、argmax={MD(G,g6 1),MD(G,g6 2)}=argmax{0.27,0.67}=2となる。
よって、グラフGと変形モデルグラフg6 1、g6 2との最大マッチング度MD6(G)=MD(G,g6 2)=0.67となる。
<判定処理>
判定部188は、モデル・マッチング部187で計算したグラフGに対する文字種Cの変形モデルグラフの最大マッチング度MDC(G)と、サイズ計算部182で計算した対象とするパターンの縦横比Rとに基づいて、接触パターン候補を判定する。
パターンの縦横比は、パターンの高さHに対するパターンの幅Wの比W/Hとする。横書きの場合は、最大マッチング度MDC(G)とのマッチング度が閾値MDth以下で、かつ、「0」より大きい、または、縦横比Rが閾値Rth以上を接触パターン候補と判定する。
すなわち、認識結果の文字種Cが正しいとすればマッチング度が大きい。よって、接触パターンは逆にマッチング度が小さくなる。よって、マッチング度が閾値MDth以下を接触パターン候補とする。但し、マッチングが「0」の変形モデルグラフよりグラフGのサイズが小さい場合は、接触パターン候補から除外する。
但し、マッチング度にかかわらず、例えば横書きのとき縦横比Rが大きい(横長である)場合は、接触パターンの可能性ありとする。式で表すと、次式(12)となる。
(MDC(G)≦MDth)∧(MDC(G)>0)∨(R>Rth)・・・(12)
判定部188は、最大マッチング度MDC(G)が小さいほど、その認識結果が信用できず接触パターンの可能性が高いと判定する。
以上述べたように、文字認識装置10によれば、一文字認識を実行して得られたカテゴリを、変形モデルとのマッチングを行うことで、そのカテゴリであることの正しさを構造的にチェックするようにした。これにより、候補数を増加させることなく文字の接触パターンを精度よく判定することができる。
また、変形モデルグラフ生成部16では、グラフ同型判定等を利用して自動的に初期変形モデルグラフを生成し、初期変形モデルグラフをモニタ104aに表示してユーザに取捨選択を促すようにした。これにより、不適切な変形モデルグラフを除去することができるため、接触パターン候補の判定の精度を高めることができる。
なお、文字認識装置10が行った処理が、複数の装置によって分散処理されるようにしてもよい。例えば、一つの装置で変形モデルグラフを生成しておき、他の装置が、そのモデルグラフを用いて接触パターンの判定を行うようにしてもよい。
以上、本発明の文字認識プログラム、文字認識方法および文字認識装置を、図示の実施の形態に基づいて説明したが、本発明はこれに限定されるものではなく、各部の構成は、同様の機能を有する任意の構成のものに置換することができる。また、本発明に、他の任意の構成物や工程が付加されていてもよい。
また、本発明は、前述した実施の形態のうちの、任意の2以上の構成(特徴)を組み合わせたものであってもよい。
なお、上記の処理機能は、コンピュータによって実現することができる。その場合、文字認識装置10が有する機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等が挙げられる。磁気記録装置としては、例えば、ハードディスク装置(HDD)、フレキシブルディスク(FD)、磁気テープ等が挙げられる。光ディスクとしては、例えば、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等が挙げられる。光磁気記録媒体としては、例えば、MO(Magneto-Optical disk)等が挙げられる。
プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD、CD−ROM等の可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。
文字認識プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送される毎に、逐次、受け取ったプログラムに従った処理を実行することもできる。
1、10 文字認識装置
2 比較手段
3 判定手段
4 記憶部
4a、4b、4c、6 構造
5 判定対象パターン
11 2値化部
12 行切り出し部
13 ラベリング部
14 文字認識用辞書格納部
14a、17a データテーブル
15 文字認識部
16 変形モデルグラフ生成部
17 変形モデルグラフ格納部
18 接触パターン候補判定部
19 接触パターンセグメンテーション部
20 出力部
161 文字種指定受付部
162 データ読込部
163 文字線幅推定部
164 細線化部
165 グラフ化部
166 グラフ整形部
167 変形モデルグラフ生成・登録部
168 変形モデルグラフ表示部
169 削除指定受付部
170 不正変形モデルグラフ削除部
181 変形モデルグラフ読込部
182 サイズ計算部
183 文字線幅推定部
184 細線化部
185 グラフ化部
186 グラフ整形部
187 モデル・マッチング部
188 判定部

Claims (5)

  1. コンピュータに、
    一文字であると判定された判定対象パターンから作成した第1のグラフを、記憶部に記憶された一文字パターンから作成した第2のグラフと比較し、前記第1のグラフの頂点間の辺の長さの合計値に対する、前記第1のグラフにおける前記第2のグラフに一致した頂点間の辺の長さの合計値の割合を算出し
    該割合が閾値以下の場合、前記判定対象パターンを複数の文字を含むパターンであると判定する
    処理を実行させることを特徴とする文字認識プログラム。
  2. 前記第2のグラフの頂点の隣接関係を、前記第1のグラフの頂点の隣接関係に対応付けることにより、前記第1のグラフにおける前記第2のグラフに一致した頂点を判定することを特徴とする請求項1記載の文字認識プログラム。
  3. 前記コンピュータに、さらに、
    前記判定対象パターンの縦横比を求め、
    該縦横比と前記割合とに基づいて、前記判定対象パターンが他の文字と接触しているか否かを判定する、
    処理を実行させることを特徴とする請求項1または2に記載の文字認識プログラム。
  4. コンピュータが、
    一文字であると判定された判定対象パターンから作成した第1のグラフを、記憶部に記憶された一文字パターンから作成した第2のグラフと比較し、前記第1のグラフの頂点間の辺の長さの合計値に対する、前記第1のグラフにおける前記第2のグラフに一致した頂点間の辺の長さの合計値の割合を算出し、
    該割合が閾値以下の場合、前記判定対象パターンを複数の文字を含むパターンであると判定する、
    ことを特徴とする文字認識方法。
  5. 一文字であると判定された判定対象パターンから作成した第1のグラフを、記憶部に記憶された一文字パターンから作成した第2のグラフと比較し、前記第1のグラフの頂点間の辺の長さの合計値に対する、前記第1のグラフにおける前記第2のグラフに一致した頂点間の辺の長さの合計値の割合を算出する比較部と、
    該割合が閾値以下の場合、前記判定対象パターンを複数の文字を含むパターンであると判定する判定部と、
    を有することを特徴とする文字認識装置。
JP2009042278A 2009-02-25 2009-02-25 文字認識プログラム、文字認識方法および文字認識装置 Expired - Fee Related JP5343617B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2009042278A JP5343617B2 (ja) 2009-02-25 2009-02-25 文字認識プログラム、文字認識方法および文字認識装置
US12/695,351 US8401298B2 (en) 2009-02-25 2010-01-28 Storage medium storing character recognition program, character recognition method, and character recognition apparatus
CN201010120503A CN101814141A (zh) 2009-02-25 2010-02-24 存储介质、字符识别方法以及字符识别设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009042278A JP5343617B2 (ja) 2009-02-25 2009-02-25 文字認識プログラム、文字認識方法および文字認識装置

Publications (2)

Publication Number Publication Date
JP2010198308A JP2010198308A (ja) 2010-09-09
JP5343617B2 true JP5343617B2 (ja) 2013-11-13

Family

ID=42621392

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009042278A Expired - Fee Related JP5343617B2 (ja) 2009-02-25 2009-02-25 文字認識プログラム、文字認識方法および文字認識装置

Country Status (3)

Country Link
US (1) US8401298B2 (ja)
JP (1) JP5343617B2 (ja)
CN (1) CN101814141A (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102385707A (zh) * 2010-08-30 2012-03-21 阿里巴巴集团控股有限公司 一种数字图像识别的方法、装置及爬虫服务器
JP6080586B2 (ja) * 2013-02-13 2017-02-15 株式会社ファインデックス 文字認識システム、文字認識プログラム及び文字認識方法
CN104200236B (zh) * 2014-08-22 2018-10-26 浙江生辉照明有限公司 基于dpm的快速目标检测方法
US10438098B2 (en) 2017-05-19 2019-10-08 Hand Held Products, Inc. High-speed OCR decode using depleted centerlines
CN109871847B (zh) * 2019-03-13 2022-09-30 厦门商集网络科技有限责任公司 一种ocr识别方法及终端
CN110851925B (zh) * 2019-10-31 2024-02-20 武汉科技大学 基于改进邻接矩阵的行星轮系同构判定方法、系统和介质

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5131053A (en) * 1988-08-10 1992-07-14 Caere Corporation Optical character recognition method and apparatus
JPH0337782A (ja) 1989-07-04 1991-02-19 Mitsubishi Electric Corp 文字パターン切り出し装置
JPH05346974A (ja) * 1992-06-16 1993-12-27 Matsushita Electric Ind Co Ltd 文字認識装置
JPH06150062A (ja) * 1992-11-05 1994-05-31 Matsushita Electric Ind Co Ltd 文字認識装置
US5600735A (en) * 1994-05-10 1997-02-04 Motorola, Inc. Method of recognizing handwritten input
JP2630261B2 (ja) 1994-06-29 1997-07-16 日本電気株式会社 文字認識装置
US6104833A (en) * 1996-01-09 2000-08-15 Fujitsu Limited Pattern recognizing apparatus and method
US6111976A (en) * 1996-11-04 2000-08-29 Rylander; John E. System and method for handwritten character recognition and qualification
US6057845A (en) * 1997-11-14 2000-05-02 Sensiva, Inc. System, method, and apparatus for generation and recognizing universal commands
SE514377C2 (sv) 1998-08-26 2001-02-19 Gunnar Sparr Teckenigenkänning
EP1052593B1 (en) * 1999-05-13 2015-07-15 Canon Kabushiki Kaisha Form search apparatus and method
JP3798179B2 (ja) * 1999-05-14 2006-07-19 富士通株式会社 パターン抽出装置及び文字切り出し装置
JP2002063385A (ja) * 2000-08-22 2002-02-28 Sony Corp 情報処理装置および方法、並びに記録媒体
JP4543675B2 (ja) * 2003-12-22 2010-09-15 パナソニック電工株式会社 文字・図形の認識方法

Also Published As

Publication number Publication date
US20100215276A1 (en) 2010-08-26
JP2010198308A (ja) 2010-09-09
CN101814141A (zh) 2010-08-25
US8401298B2 (en) 2013-03-19

Similar Documents

Publication Publication Date Title
US10685462B2 (en) Automatic data extraction from a digital image
JP3822277B2 (ja) 文字テンプレートセット学習マシン動作方法
Dalitz et al. A comparative study of staff removal algorithms
WO2018108129A1 (zh) 用于识别物体类别的方法及装置、电子设备
US7792369B2 (en) Form processing method, form processing device, and computer product
JP5031741B2 (ja) 文書視覚構造の文法的な解析
Mahmoud Recognition of writer-independent off-line handwritten Arabic (Indian) numerals using hidden Markov models
JP5343617B2 (ja) 文字認識プログラム、文字認識方法および文字認識装置
JP2004139484A (ja) 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム
WO2018003153A1 (ja) 認識装置及び認識方法
JPS61267177A (ja) 文書画像追加情報の蓄積方法
Madhvanath et al. Syntactic methodology of pruning large lexicons in cursive script recognition
Mohammad et al. Contour-based character segmentation for printed Arabic text with diacritics
WO2021131324A1 (ja) 情報処理装置、情報処理方法、及びプログラム
CN110826488B (zh) 一种针对电子文档的图像识别方法、装置及存储设备
Lee et al. Deep learning-based digitalization of a part catalog book to generate part specification by a neutral reference data dictionary
Suwanwiwat et al. Benchmarked multi-script Thai scene text dataset and its multi-class detection solution
Tehsin et al. A caption text detection method from images/videos for efficient indexing and retrieval of multimedia data
Pham et al. A deep learning approach for text segmentation in document analysis
JP2023003887A (ja) 書類画像処理システム、書類画像処理方法、および書類画像処理プログラム
Delalandre et al. Performance evaluation of symbol recognition and spotting systems: An overview
Widiarti et al. Clustering Balinese Script Image in Palm Leaf Using Hierarchical K-Means Algorithm
JP6511942B2 (ja) 情報処理装置および情報処理プログラム
Bogacz Analyzing handwritten and transcribed symbols in disparate corpora
Liu et al. Table detection method based on feature pyramid network with faster R-CNN

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111006

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130312

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130319

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130509

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130716

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130729

R150 Certificate of patent or registration of utility model

Ref document number: 5343617

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees