JP2005084765A - 文字認識装置及び方法及びそのプログラム - Google Patents
文字認識装置及び方法及びそのプログラム Download PDFInfo
- Publication number
- JP2005084765A JP2005084765A JP2003313367A JP2003313367A JP2005084765A JP 2005084765 A JP2005084765 A JP 2005084765A JP 2003313367 A JP2003313367 A JP 2003313367A JP 2003313367 A JP2003313367 A JP 2003313367A JP 2005084765 A JP2005084765 A JP 2005084765A
- Authority
- JP
- Japan
- Prior art keywords
- character
- image
- unit
- recognition
- rotated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/186—Extraction of features or characteristics of the image by deriving mathematical or geometrical properties from the whole image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Mathematical Analysis (AREA)
- Algebra (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
【課題】固有空間法を応用して、回転文字をその回転角度を問わずに正確に文字認識する文字認識装置を提供することを目的とする。
【解決手段】文字認識装置は、複数の回転文字画像から作成された固有空間を格納する空間格納部32と、複数の回転文字画像を対応する固有空間に投影して得た投影点の描く軌跡を格納する軌跡格納部33と、認識対象文字の画像を入力する入力部1と、認識対象文字の画像を固有空間に投影して得た投影点と複数の文字種についての軌跡の各々との距離を求める距離算出部27と、前記距離に基づいて認識対象文字の画像の候補を複数の文字種の中から選択する候補選択部28とを備える。
【選択図】図1
【解決手段】文字認識装置は、複数の回転文字画像から作成された固有空間を格納する空間格納部32と、複数の回転文字画像を対応する固有空間に投影して得た投影点の描く軌跡を格納する軌跡格納部33と、認識対象文字の画像を入力する入力部1と、認識対象文字の画像を固有空間に投影して得た投影点と複数の文字種についての軌跡の各々との距離を求める距離算出部27と、前記距離に基づいて認識対象文字の画像の候補を複数の文字種の中から選択する候補選択部28とを備える。
【選択図】図1
Description
本発明は、文字認識装置及び方法及びそのプログラムに関し、特に、固有空間法を応用して、回転文字をその回転角度を問わずに正確に文字認識する文字認識装置及び方法及びそのプログラムに関する。
カタログ等の印刷された文書では、人々の注意を引くために、文字を歪めたり、傾けたり、回転したり、流行形(例えば、装飾を施した文字等)にしたりする場合がある。このような文書をスキャナにより読み取って、コンピュータで文字認識処理を行って、文字をコード化した電子データを得ることがある。
例えば、回転した文字は、一般には、文字を所定の刻み(例えば、10度、20度、・・・)で回転させた画像(パターン)のビットマップデータを辞書として予め用意し、読み取った文字の画像(ビットマップ)と辞書の各パターンとを何らかの手段で比較することにより認識している(例えば、特許文献1参照)。
また、これまでに、いくつかの回転不変の文字認識方法が提案されており、主に3つのアプローチがある。第1は、回転に不変の特徴を抽出する方法である(非特許文献1参照)。第2は、ニューラルネットワークを使う方法である(非特許文献2参照)。第3は、複数のテンプレートを使ったものである。例えば、Xie et alは違う角度の複数の標準パターンを用意することで回転に不変のシステムを提案している(非特許文献3参照)。また、数学モデルを使って文字並びを推定し文字の向きを正規化して認識する方法が考察されている(非特許文献4参照)。
特開平5−12491号公報
S.X.Liao and M.Pawlak, "On Image Analysis by Moments," IEEE Trans. on PAMI, Vol.18, No.3, pp.254-266, (1996)
S.Sato, S.Miyake and H.Aso, "Evaluation of Two Neocognitron-type Models for Recognition of Rotated Patterns," ICONIP 2000, WBP-04, pp.295-299 (2000)
Q.Xie, A.Kobayashi, "A Construction of Pattern Recognition System Invariant of Translation, Scale-change and Rotation Transformation of Patterns (in Japanese)," Trans. of The Society of Instrument and Control Engineers, Vol.27, No.10, pp.1167-1174 (1991)
H.Hase, M.Yoneda, T.Shinokawa, C.Y. Suen, "Alignment of Free Layout Color Texts for Character Recognition," Proceedings of the 6th International Conference on Document Analysis and Recognition, pp.932-936 (Seatle, USA)
コンピュータによる文字認識は、文字のある程度の変形ならば、手書き文字認識の手法等を使うことにより可能なように思われる。しかし、実際には、傾いたり回転したりしている文字の傾斜(又は、回転)角度を見積もることが難しいため、コンピュータによるこれらの文字認識は一般に困難である。図18に傾いたり、回転した文字列の一例を示す。図18(a)の例(通常に印刷された例)を除き、図18(b)〜図18(d)の例についてのコンピュータによる文字認識は困難である。特に、波うっている図18(c)の例、傾斜の角度が文字の向きが変わるほどに大きく変化する図18(d)の例の文字認識は困難である。
これらの文字認識は、裏返した文字や鏡像さえも読むことのできる人間にとっては、極めて容易である。人間は、柔軟な認知能力により、文字の並びと向きを容易に見分け判断しているからである。しかし、これと同じことは、コンピュータには困難である。また、文字認識しないで、文字の整列または文字の向きの規則を見つけることは、コンピュータには困難である。
例えば、前述の辞書を用いる方法においては、読み取った文字の傾斜角度は任意の角度であるため、当該角度が辞書に登録された文字の傾斜の角度に一致することは殆どない。このため、文字認識の精度が低下してしまい、又は、文字を正立させるために当該角度を正確に捕捉することができなかった。
また、前述の回転不変の文字認識方法においては、満足できる文字認識の精度が得られなかったり、適用の範囲が極めて限られ実用化できなかった。例えば、非特許文献3によれば、10種類の(少数の)数字に対してでさえ、97%の認識結果しか得られていない。また、非特許文献4によれば、文字列はいつでもそのような数学モデルで並んでいるとは限らない。
そこで、本発明者は、パラメトリック固有空間法(単に固有空間法とも言う)を応用して回転した文字を認識すれば、その認識率が高まるのではないかと考えた。パラメトリック固有空間法は、本来は物体認識に関する技術であり、「村瀬 洋,S.K.Nayar ,”2次元照合による3次元物体認識−パラメトリック固有空間法−,”信学論(D-II)号,vol.J77- D-II, no.11, pp.2179-2187, Nov. 1994.」に示されている。本発明者の検討によれば、この文字認識方法を文字認識に適用した場合、認識結果(カテゴリ)と同時に傾斜角度を得ることができる優位性を有すると考えられる。
本発明は、固有空間法を応用して、回転文字をその回転角度を問わずに正確に文字認識する文字認識装置を提供することを目的とする。
また、本発明は、固有空間法を応用して、回転文字をその回転角度を問わずに正確に文字認識する文字認識方法を提供することを目的とする。
また、本発明は、固有空間法を応用して、回転文字をその回転角度を問わずに正確に文字認識する文字認識プログラムを提供することを目的とする。
本発明の文字認識装置は、当該文字種の1文字画像を複数の角度に回転して得た複数の回転文字画像から作成された固有空間を、複数の文字種について格納する空間格納部と、前記複数の回転文字画像を対応する前記固有空間に投影して得た投影点の描く軌跡を、前記複数の文字種について格納する軌跡格納部と、認識対象文字の画像を入力する入力部と、前記認識対象文字の画像を前記固有空間に投影して得た前記認識対象文字の投影点と、前記複数の文字種についての軌跡の各々との距離を求める距離算出部と、前記算出された距離に基づいて、前記認識対象文字の画像の候補を前記複数の文字種の中から選択する候補選択部とを備える。
本発明の文字認識方法は、当該文字種の1文字画像を複数の角度に回転して得た複数の回転文字画像から作成された固有空間を、複数の文字種について用意し、前記複数の回転文字画像を対応する前記固有空間に投影して得た投影点の描く軌跡を、前記複数の文字種について用意し、認識対象文字を入力し、前記認識対象文字の画像を前記固有空間に投影して得た前記認識対象文字の投影点と、前記複数の文字種についての軌跡の各々との距離を求め、前記算出された距離に基づいて、前記認識対象文字の画像の候補を前記複数の文字種の中から選択する。
本発明の文字認識プログラムは、文字認識装置における文字認識方法を実現するプログラムであって、前記プログラムは、コンピュータに、当該文字種の1文字画像を複数の角度に回転して得た複数の回転文字画像から作成された固有空間と、前記複数の回転文字画像を対応する前記固有空間に投影して得た投影点の描く軌跡とを、前記複数の文字種について用意する処理と、認識対象文字の画像を入力する処理と、前記認識対象文字の画像を前記固有空間に投影して得た前記認識対象文字の投影点と、前記複数の文字種についての軌跡の各々との距離を求める処理と、前記算出された距離に基づいて、前記認識対象文字の画像の候補を前記複数の文字種の中から選択する処理とを行わせる。
本発明の文字認識装置及び方法によれば、本来は物体認識に関する技術である固有空間法を応用して、回転した文字を認識する。即ち、十分な数の回転文字画像から共分散行列を計算して各々の文字種(カテゴリ)の固有(部分)空間を作成する。次に、それらの回転文字画像を固有(部分)空間上に投影(及び補間)することにより、その軌跡を得る。各々のカテゴリの固有(部分)空間の上に未知文字(認識対象の文字)が投影され、未知文字の投影点と軌跡の間の距離を計算し、この距離に基づいて認識を行う。
これにより、読み取った文字の傾斜角度が辞書に登録された文字の傾斜の角度に一致しない場合や、読み取った文字の並びが不規則な場合でも、文字認識の精度を低下させることなく極めて広い範囲において実用的に満足できる極めて高い認識結果(例えば、アルファベット26文字の場合、99.89%)を得ることができ、また、文字認識と同時に、当該文字の傾斜角度を正確に得ることができる。
本発明の文字認識プログラムによれば、これをフレキシブルディスク、CD−ROM、CD−R/W、DVD等の媒体に格納すること、又は、インターネット等のネットワークを介してダウンロードすることにより供給することができ、これにより前述の文字認識装置及び方法を容易に実現することができ、正確な文字認識を可能とすることができる。
図1は、文字認識装置構成図であり、本発明の文字認識装置の構成を示す。文字認識装置は、入力部1、文字認識処理部2、記憶部3を備える。文字認識処理部2は、登録処理部21、認識処理部26を備える。記憶部3は、画像格納部31、空間格納部32、軌跡格納部33を備える。
入力部1は、例えば周知のスキャナ等の画像読取装置からなり、登録対象又は認識対象として読み取った(1又は複数の)文字の画像(ビットマップデータ)を、文字認識処理部2に入力する。即ち、入力部1は、登録処理部21(の画像登録部22)へ登録対象の文字を入力し、認識処理部26(の距離算出部27)へ認識対象の文字を入力する。
文字認識処理部2(登録処理部21及び認識処理部26)は、コンピュータ(の本体)であり、CPU及び主メモリを備え、主メモリ上の登録処理及び認識処理を行うプログラムをCPU上で実行することにより実現される。
文字認識処理部2は、登録処理部21において、入力部1から入力された登録対象の文字を用いて、本発明の文字認識処理において使用する辞書である画像格納部31、空間格納部32及び軌跡格納部33を作成し、記憶部3に登録する。登録処理部21は、画像登録部22、空間作成部23、画像投影部24、軌跡補間部25を備える。
なお、登録処理部21は省略しても良い。即ち、辞書である画像格納部31、空間格納部32及び軌跡格納部33は、登録処理部21により作成することなく、別に予め作成されフレキシブルディスク、CD−ROM、CD−R/W、DVD等の媒体に格納された辞書を、記憶部3に登録することにより、用意するようにしても良い。又は、文字認識処理部2が、他のコンピュータに設けられた登録処理部21が作成した辞書である画像格納部31、空間格納部32及び軌跡格納部33を、インターネット等のネットワークを介してダウンロードして、記憶部3に格納するようにしても良い。
文字認識処理部2は、認識処理部26において、入力部1から入力された認識対象の文字について、辞書である空間格納部32及び軌跡格納部33を使用して、本発明の文字認識処理を実行し、認識結果を出力する。認識処理部26は、距離算出部27、候補選択部28、候補比較部29を備える。
画像登録部22は、入力部1から登録対象の文字(例えば、文字「A」)が入力されると、当該画像を認識して当該文字(画像)を所定の刻み(例えば、10度)で360度回転させる。これにより、画像登録部22は、当該文字についての複数の回転文字画像を作成する。画像登録部22は、このような複数の回転文字画像を、複数の文字種(例えば、アルファベットの26文字種)について作成する。なお、この画像を認識し回転して複数の回転文字画像を作成する処理は、例えば入力部1が行っても良い。画像登録部22は、複数の文字種について作成した複数の回転文字画像を画像格納部31に格納する。
例えば、図2に示すように、文字種「A」の1文字画像(Century のフォントの1個の画像)を時計回り(又は、反時計回り)方向に10度ずつ回転させた文字(回転文字画像)を36個用意する。これにより、回転の角度として全ての方向即ち360度をカバーする。これらの回転文字画像は学習文字(学習サンプル)として使用される。回転文字画像を、
とする。但し、kは1からCの値をとるカテゴリ(即ち、文字の種類(文字種)の)番号(又は、カテゴリ添え字)であり、θ(i)は文字の傾斜角度であり、
θ(i)=10×i (i=0,1,2,・・・,35)
である。
θ(i)=10×i (i=0,1,2,・・・,35)
である。
各々の回転文字画像は、例えば32画素×32画素(=1024画素)の大きさであり、全ての画像は正規化されている。画素の値は「0」又は「1」である。従って、この回転文字画像データは1024次元ベクトル(1024個の固有ベクトル)で記述することができる。
画像格納部31は、当該文字種の1文字画像(例えば、文字種「A」のCentury のフォントの1個の画像)を複数の角度に回転して得た複数の回転文字画像を、複数の文字種について格納する。具体的には、画像格納部31は、当該文字を10度ずつ回転して得た36個(0度、10度、20度、・・・)の回転文字画像を、複数の文字種について格納する。回転文字画像は、後述するように、固有空間に投影して得た回転文字の投影点の描く軌跡を得る(学習する)ための学習サンプル(又は、学習文字)である。回転の角度は、10度に限らないが、「360」の公約数であることが望ましい。即ち、学習サンプルの個数は、1文字当たり36個に限らない。
空間作成部23は、画像格納部31に格納された複数の回転文字画像を使って共分散行列を計算し、固有値と対応した固有ベクトルを計算する。そして、空間作成部23は、得られた固有ベクトルを固有値の大きい順に並べる。即ち、固有空間を作成し、空間格納部32に格納する。固有空間は複数の文字種毎に作成される。
空間格納部32は、空間作成部23により作成された固有空間を、複数の文字種毎に格納する。即ち、空間格納部32は、当該文字種の1文字画像を複数の角度に回転して得た複数の回転文字画像から作成された固有空間を、複数の文字種について格納する。
画像投影部24は、画像格納部31に格納された複数の回転文字画像(学習サンプル)の各々を、空間格納部32に格納された当該学習サンプルに対応する固有(部分)空間に投影する。1個の学習サンプルから固有空間における1個の投影点が得られる。投影点は当該学習サンプルに特有の値を取る。これにより、画像投影部24は、当該固有空間において当該文字の投影点からなる(投影点の描く)軌跡を得る。画像投影部24は、このような当該文字の固有値の描く軌跡を、複数の文字種について作成し、軌跡格納部33に格納する。投影点の描く軌跡は、当該文字に特有の(複数次元の)形状を示す。
前述の例によれば、各々のカテゴリ(文字の種類)において、36個の回転文字画像(の画像データ)を使用して固有空間を作る。各々のカテゴリについて、その共分散行列Σ(k) ( =1024×1024)は、
で計算することができる。但し、mk はk番目のカテゴリの平均ベクトル(平均画像)である。共分散行列は次式を満足する。
Σ(k) φ=λφ 式(2)
但し、カテゴリ添え字kはλとφに対して省略している。
但し、カテゴリ添え字kはλとφに対して省略している。
この例の場合、共分散行列のランクは最大35であるから、最大35個の「0」以外の固有値を得ることができる。ここでは、各々の固有値をλ1,λ2,・・・, λ35とし、対応する固有ベクトルをφ1,φ2,・・・, φ35とする。最初のn(n≦35)個の固有ベクトルを使って、固有(部分)空間Un (k) ={φ1,φ2,・・・, φn }を形成する。
次に、Un (k) 上に投影された
の投影点
である。回転角度は前述のように連続的に変化するので、その投影点の集合
は連続な軌跡を描く。
図3は、軌跡Ln (k) の模式図を示す。図3において、n=3である。即ち、この固有(部分)空間は、カテゴリkについて、3個の固有ベクトルφ1,φ2,φ3 を用いて表した3次元の固有(部分)空間である。また、図3において、「・」が学習文字の投影点であり、これらを結んだ実線が軌跡L3 (k) であり、未知文字の投影点Xと軌跡L3 (k) とを結ぶ点線(垂線)がこれらの間の最短距離dk (X)を示す。垂線と軌跡L3 (k) との交点の両側に存在する2個の学習文字の投影点(又は、補間した2点)と、投影点Xの軌跡上の最短点との間の距離が後述するl1 とl2 である。
軌跡格納部33は、当該文字種の1文字画像を複数の角度に回転して得た複数の回転文字画像の各々を、対応する固有空間に投影して得た投影点の描く軌跡を、複数の文字種について格納する。即ち、登録対象の文字毎の投影点の描く軌跡が、辞書として備えられる。従って、文字認識処理において直接に使用される辞書は空間格納部32と初軌跡格納部33であり、記憶部3において画像格納部31を除く空間格納部32と初軌跡格納部33が認識処理部26により参照される。
軌跡補間部25は、複数の文字種について、前記複数の回転文字画像(学習サンプル)の各々を固有空間に投影して得た学習文字の投影点を、所定の処理により補間する。即ち、補間点を求める。具体的には、軌跡補間部25は、画像投影部24が求めた投影点を周知の周期スプラインを用いて補間するスプライン補間を行う。例えば、軌跡補間部25は、36個の回転文字画像の各々を固有空間に投影して得た当該文字の36個の投影点を周期スプラインにより1000点で補間する。この場合、画像投影部24が、軌跡補間部25が求めた投影点を補間する値(補間点)と投影点との描く軌跡を、複数の文字種について軌跡格納部33に格納する。これにより、学習サンプルの投影点のみでは滑らかな軌跡を描けない場合でも、当該投影点とその補間値とで滑らかな軌跡を得ることができる。また、この軌跡は補間を用いずに全体又は区分的に関数により表現することができる。
なお、軌跡補間部25は省略しても良い。即ち、学習サンプルの数を、例えば120個(3度刻み)、180個(2度刻み)等とすれば、比較的滑らかな軌跡が得られる。そこで、このような場合には、軌跡補間部25は省略しても良い。
距離算出部27は、入力部1から認識対象の文字(例えば、文字種「A」の1文字画像)が入力されると、辞書である空間格納部32及び軌跡格納部33を用いて、当該認識対象の文字を固有空間に投影することにより、当該認識対象文字(未知文字)の投影点を得る。そして、距離算出部27は、当該未知文字の投影点と、複数の文字種(例えば、アルファベットの文字種)についての軌跡の各々との距離を求める。この距離は、当該文字の投影点から軌跡に対して垂線を引いた場合における当該垂線の長さである。例えば、複数の文字がアルファベットである場合、26個の距離が算出される。この距離のなかで最小の距離を持つ文字が当該認識対象の文字種である。
即ち、与えられた未知文字画像データxを、全てのUn (k) (k=1,2,・・・,C)上に投影する。xの投影点Xは、
である。投影点Xと図3に示す軌跡Ln (k) との最小の距離の点を探すことによって、辞書(軌跡Ln (k) )との照合が行われる。ここで、カテゴリk(添え字kで表される文字)の最小距離をdk (X)とすると、認識結果k* は、
と書くことができる。
一方、未知文字画像(認識対象の文字)の回転角度θは、当該投影点Xに最も接近している軌跡Ln (k) 上における2つの最も近接している点(学習文字の投影点又は補間した点)を使用することにより算出することができる。例えば、図3に示す例においては、その角度θk は、
の2つの点によって補間される。即ち、
とする。但し、l1 とl2 は図3に示す長さである。
以上のように、本発明によれば、入力画像(認識対象の文字)の認識結果(文字種即ちカテゴリk)と文字の回転角度θとを、同時に得ることができる。図4に認識方法の概略図を示す。図4において、カテゴリk=1の文字の固有空間における軌跡L3 (1) が図示のようになり、未知文字xが固有空間に投影され、その投影点がXで示される。この時、両者の間の距離d1 (X)と入力画像の回転角度θ1 とが、前述のように求められる。同様にして、k=2〜Cの固有空間の各々において、距離dk (X)及び角度θk が求められる。
候補選択部28は、算出された距離に基づいて、認識対象文字の(画像の)候補を複数の文字種の中から選択する。具体的には、候補選択部28は、複数の文字種の中で算出された距離が最も短いものを1個だけ選択し、これを認識対象の文字種(文字の種類)として決定する。また、候補選択部28は、前述のように、認識対象文字の投影点と、軌跡上の近接する2点を用いた所定の演算により、認識対象文字の回転角度を決定する。例えば、図4に示す例において、距離d1 (X)が最短であるとすると、カテゴリk=1の文字種(例えば、文字種「A」)が認識対象の文字(未知の文字の入力画像)とされ、また、その回転角度がθ1 とされる。
以上の構成によれば、基本的には、認識対象文字(未知文字)について、その文字種と回転角度とを、高い精度で認識することができる。しかし、更に、文字フォントの変化や文字変形に対応して、文字認識の精度を向上させたい場合には、候補比較部29を設けるようにしても良い。この場合、候補選択部28は、複数の文字の中で算出された距離が短いものを複数個選択し、これを認識対象の文字の候補として決定する。候補比較部29は、候補選択部28により選択された(複数の)候補を相互に比較して、認識対象の文字を決定する。
具体的には、候補比較部29は、図5に示すように、認識対象文字(入力された文字)を所定の角度ずつ回転して、複数の回転文字画像を得る。例えば、図5において、入力された文字種は「A」であり(実際には未知である)、これを基準即ち0度(実際には回転しているかもしれない)として120度ずつ回転する。これにより、合計で3個の回転文字画像が得られる。この処理は、実際には、入力部1又は画像登録部22が実行しても良い。
次に、候補比較部29は、複数の回転文字画像を、候補選択部28により選択された複数の候補の各々に対応する固有空間に投影して、各々の固有空間における複数の投影点を得る。例えば、図5において、前記候補にカテゴリkの文字種が含まれているとすると、当該固有空間kに前記3個の回転文字画像を投影する。これにより、3個の回転文字画像の投影点が得られ、当該3個の投影点とカテゴリkの文字種の軌跡との距離d1 k (X)、d2 k (X)及びd3 k (X)が得られる(順不動)。他のカテゴリについても同様である。この処理は、実際には、画像投影部24が実行しても良い。
次に、候補比較部29は、候補選択部28により選択された候補の中で、前記複数の投影点に最も近いものを、認識対象文字の文字種とする。例えば、図5において、前述の算出した距離d1 k (X)、d2 k (X)及びd3 k (X)の平均値を求めて、これを認識対象文字(未知文字)と当該候補との距離dk (X)とする。他のカテゴリ(他の候補)についても同様である。そこで、候補比較部29は、前記候補の中で、平均距離の最も短いものを、認識対象文字の文字種とする。即ち、前記複数の距離を最小にする軌跡を持つ文字種が当該未知文字の文字種であると推定することができる。これにより、文字フォントの変化や文字変形に強い文字認識を行うことができる。
図6は、文字認識処理フローであり、本発明の図1に示す文字認識処理装置における文字認識処理を示す。
入力部1が読み取った登録対象文字の画像が画像登録部22に入力されると、画像登録部22が、当該文字を複数の角度に回転して、複数の回転文字画像(学習サンプル)を作成し、画像格納部31に登録する(ステップS1)。登録対象の複数の文字の各々について、複数の回転文字画像が作成され登録される。
次に、空間作成部23が、文字種毎に、画像格納部31から複数の学習サンプルを読み出して、固有空間を作成する(ステップS2)。これにより、登録対象の複数の文字種の各々について、複数の学習サンプルに基づく当該文字種の固有空間が得られる。
次に、画像投影部24が、文字種毎に、画像格納部31から複数の学習サンプルを読み出して、固有空間へ投影する(ステップS3)。これにより、登録対象の複数の文字種の各々について、対応する固有空間における学習サンプルの数の(複数の)投影点が得られ、結果として、これらの描く軌跡(折れ線状の又は荒い軌跡)が得られる。
次に、軌跡補間部25が、文字種毎に、画像投影部24が求めた固有値を、周期スプライン等の補間法を用いて補間する(ステップS4)。これにより、軌跡補間部25が求めた投影点を補間する値が得られ、結果として、当該補間値と投影点との描く軌跡(滑らかな軌跡)が得られる。そして、画像投影部24が、登録対象の複数の文字の各々について、当該滑らかな軌跡を軌跡格納部33に格納する。
次に、入力部1が読み取った認識対象文字の画像を距離算出部27に入力すると(ステップS5)、距離算出部27が、認識対象文字(未知文字)を固有空間に投影して当該文字の投影点を得て、当該投影点から複数の文字種についての軌跡の各々への距離(即ち、投影空間における最短距離とその位置)を求める(ステップS6)。
次に、候補選択部28が、算出された距離に基づいて、認識対象の文字の候補を複数の文字種の中から選択する。即ち、文字種及び角度の候補を決定する(ステップS7)。
次に、候補比較部29が、候補を比較して文字種及び角度即ち認識対象の文字を決定する(ステップS8)。即ち、候補比較部29が、認識対象文字を所定の角度ずつ回転して、複数の回転文字画像を得る。前述のように、この処理は画像登録部22又は入力部1が実行しても良い。次に、候補比較部29が、複数の回転文字画像を候補選択部28により選択された候補に対応する固有空間に投影して、複数の投影点を得る。この処理は画像投影部24が実行しても良い。次に、候補比較部29が、候補選択部28により選択された候補の中で、前記複数の投影点に最も近いもの(例えば、平均距離が最も短いもの)を、認識対象文字の文字種とする。
登録対象の文字(カテゴリ)として、英語のアルファベットの26個のCentury フォントの大文字(A,B,・・・,Z)を使用した。最初に、各々のカテゴリについて、大きさ32画素×32画素の「0度」の文字パターンを作成した。ここで、「0度」とは、文字が正立した状態を言う。次に、「0度」の文字パターンを、例えば「10度」ずつ回転させて、文字画像の外接領域内で再標本化した。これにより、大きさ32画素×32画素の回転文字画像(学習サンプル)を36個作成した。従って、この時点での特徴次元は1024次元である。これらの回転文字から共分散行列を求め、固有値と固有ベクトルを計算する。固有値と固有ベクトルは、例えば数学ソフトウェアMathematica Book(Stephen Wolfram, "Mathematica Book," Wolfram Research, Inc. Vol.4 (2000))により計算すれば良い。
図7は、文字「A」の固有値の例を示す。35個の「0」より大きな固有値が得られているのが判る。固有値の大きな順に対応する固有ベクトルを並べ、上位n個の固有ベクトルからn次元固有部分空間を構成する。ここで、nの値は文字認識についての意味を持つ(即ち、要求される文字認識性能を満足する)十分な数とされる。nの値は認識可能の範囲とされた文字種の数等に依存する。従って、候補選択部28は、複数の回転文字画像の各々を文字認識についての意味を持つ十分な次元の固有空間に投影する。これにより、認識可能の範囲とされた文字種について、少ない次元(計算量)で有効な文字認識を行うことができる。
そこで、紙面上への図示の便宜を考えて、2次元の固有(部分)空間への投影を行った。図8は、全てのカテゴリ(K=1〜26)において、2次元の固有(部分)空間上に投影された36個の学習サンプルの折れ線の(滑らかでない)軌跡の一例を示す。即ち、文字「A」「B」「Y」「Z」を示す。これらの軌跡は、全てのカテゴリにおいて固有の形状を有しており、文字自体の形状からは予想できない形をしていることが判る。また、2次元でも十分に当該文字の特徴が現れることが判る。従って、文字認識処理の実際からも、候補選択部28は、複数の回転文字画像の各々を文字の認識についての意味を持つ次元(まで)の固有空間に投影する。
投影点Xから軌跡Ln (k) までの距離は、以下のように計算した。第1に、軌跡Ln (k) において、36個の学習サンプルの投影点(サンプル投影点)を、周知の補間法、例えば周期スプラインを用いて、例えば1000点で補間した。これにより、滑らかな軌跡Ln (k) が得られる。各々の投影点Xの角度は、前述の式(4)により計算した。図9は周期スプラインにより補間した軌跡Ln (k) の例を示す。第2に、実際には、1000個の補間した点(補間点)の各々、及び、サンプル投影点(画像投影部24が求めた複数の投影点)の各々についての座標及び角度を格納するテーブルを作成し、投影点Xから軌跡Ln (k) までの距離はこのテーブルを使用して計算した。なお、周知の補間法としては、例えばラグランジェ補間を用いても良い。
一方、未知の文字(認識対象の文字)として、学習サンプルを含まないようにするために、当該文字を「3度」ごとに回転したテストパターンを、テストに用いた。即ち、0度,3度,・・・,357度のCentury フォントの大文字(即ち、先のフォントと同一)をテストパターンに使った。従って、各々のカテゴリについて108テストサンプル(120サンプルから学習サンプルと重なるものを除く)、全てのカテゴリについて見ると2808(=108×26)サンプルを使用した。
図10は、固有(部分)空間の次元の数に対する文字認識率のグラフである。4次元までで、文字認識率は既に90%以上に達しているのが判る。13次元の固有(部分)空間では、最高認識率99.89%(3サンプルは失敗した)が得られた。この3サンプルの誤認識の理由は、学習サンプルの数が部分的に十分でなかったこと、又は、10度ごとの回転が適当でないこと等が考えられる。後者については、更に、不均一な角度での回転が有効であるかもしれないこと、又は、10度以下の回転が有効であるかもしれないこと等が考えられる。しかし、認識対象文字とされた第1候補〜第3候補との距離は、3つの誤認識したサンプルの全てにおいて極めて小さかった。例えば、後述する図12のサンプル5(N(177):文字「N」を177度回転した回転文字画像、以下同じ)では、第1候補(誤認識)の距離は3.422であり、第3候補(正解)は3.449であった。
このように、本発明においては、入力文字画像についてのカテゴリだけでなく、回転角度も得ることができる。図11は、回転角度の精度の評価を示す。図11において、横軸に回転角度の誤差(正解の角度と認識された角度との差)を、縦軸に当該誤差に該当したサンプル数を示す。対称形状の文字で、90度あるいは180度回転して認識されたサンプルは評価対象から除外されている。図11に示すグラフから、テストサンプルのほとんど全ての回転角度が正確に評価されていることが判る。
次に、具体的ないくつかのサンプルについて示す。図12は、6個のパターンに対する本発明の文字認識の結果得られた上位の第1候補から第3候補までを示している。最初の3個のサンプル(入力データの#1,#2,#3)は正しく認識したものであり、次の3個のサンプル(入力データの#4,#5,#6)は誤認識したものである。カッコ内の数は角度を表している。図12から、誤認識したサンプルについても、上位の3候補の中に正解のカテゴリ(文字種)があることが判る。
図13は、各カテゴリに対する文字認識率を示す。アルファベット文字の中には対称的なパターンがある。例えば、文字「H」「I」「N」「O」「S」「X」「Z」は180度回転させた場合、相互に殆ど同じ形状をしている。例えば、図12の入力データのサンプル#2と#3である。図13のグラフにおいて、「網かけ」により示す領域(correct )は、正しいカテゴリ及び正しい回転角度が得られた割合を示す。「斜線」により示す領域(upside-down )は、正しいカテゴリは得られたが、間違った回転角度(およそ180度の差)であった割合を示す。従って、図13から、文字「H」「I」「O」「X」等は、本来が対称形状であるために、180度回転して認識されたことが推測される。なお、正しいカテゴリ及び正しい回転角度が得られなかった割合(error)の領域は殆んど無かった。
登録対象の文字(カテゴリ)として、実施例1と同様のフォント(アルファベットのCentury フォントの大文字、26個)を使用して、文字の大きさを変えて、文字認識処理を行った。これにより、文字の大きさの変化が文字認識率に与える影響を見た。
即ち、各々のカテゴリについて、大きさ16画素×16画素の文字パターンを作成し、実施例1と同様に、本発明による文字認識処理を行った。この場合、特徴次元は256(=16×16)次元である。図14は、固有(部分)空間の次元の各々における文字認識率を示す。図14から、32×32画素の場合に比べて、約1%程度、文字認識率が落ちることが判る。13次元での文字認識率は99.07%であった。また、14次元の固有(部分)空間で最高認識率99.15%(24サンプルで失敗した)であった。
実施例1と同様の文字種(カテゴリ)と実施例1で作成した軌跡を用い、入力文字のフォントの種類を代えて、文字認識処理を行った。これにより、フォントの種類の変化が文字認識率に与える影響を見た。
即ち、各々のカテゴリについて、実施例1で作成した固有(部分)空間を用いた。そして、図15に示すCourier フォントとTimes New Roman フォントの2種類を認識対象文字として、本発明の文字認識処理を行った。なお、図15にCentury フォントを参考に示す。実施例1と同様に、各カテゴリについて108テストサンプル(学習サンプルに対応する回転角度のものを除く)、全カテゴリについて2808(=108×26)サンプルを、文字認識処理した。図16はCourier フォントの場合の固有(部分)空間の次元に対する文字認識率を示し、図17はTimes New Roman フォントの場合の固有(部分)空間の次元に対する文字認識率を示す。
図16から判るように、Courier フォントの場合、13次元で認識率83.40%であり、17次元の固有(部分)空間で最高認識率84.33%(440サンプル失敗)であった。図17から判るように、Times New Roman フォントの場合、13次元で認識率936.63%であり、16次元の固有(部分)空間で最高認識率93.95%(170サンプル失敗)であった。Times New Roman フォントは、Century フォントに字形が似ているために、Courier フォントに比べて高い文字認識率が得られたと考えられる。
以上のように、Century フォントを使って固有(部分)空間を作成した場合、同じCentury フォントに対する結果は、非常に高い文字認識の正解率及び文字の回転角度の正解率を示した。32画素×32画素に正規化した場合と16画素×16画素に正規化した場合とでは、文字認識率において、あまり大きな低下はなかった。また、フォントの種類が異なると、文字認識率は低下するが、ある程度の正解率は得られた。
以上、本発明をその実施の形態に従って説明したが、本発明は、その主旨の範囲内で種々の変形が可能である。
例えば、認識対象の文字(文字種)は、アルファベットに限られず、平仮名、片仮名、漢字、その他種々の言語の文字、数字、記号をも含む。また、認識対象の文字(文字種)は、同一の文字種についての異なるフォントをも含む。更に、複数のフォントの当該文字の平均文字画像を学習文字として用いることにより、複数のフォントに対して高い文字認識率を得ることができる。
以上説明したように、本発明によれば、文字認識装置及び方法において、固有空間法を応用して回転した文字を認識することにより、読み取った文字の傾斜角度が辞書に登録された文字の傾斜角度に一致しない場合や、読み取った文字の並びが不規則な場合でも、文字認識の精度を低下させることなく極めて広い範囲において実用的に満足できる極めて高い認識結果を得ることができ、また、認識と同時に当該文字の傾斜角度を正確に得ることができる。
また、本発明によれば、文字認識装置プログラムを、フレキシブルディスク、CD−ROM、CD−R/W、DVD等の媒体に格納することにより供給することにより、前述の文字認識装置及び方法を容易に実現することができる。
1 入力部
2 文字認識処理部
3 記憶部
21 登録処理部
22 画像登録部
23 空間作成部
24 画像投影部
25 軌跡補間部
26 認識処理部
27 距離算出部
28 候補選択部
29 候補比較部
31 画像格納部
32 空間格納部
32 軌跡格納部
2 文字認識処理部
3 記憶部
21 登録処理部
22 画像登録部
23 空間作成部
24 画像投影部
25 軌跡補間部
26 認識処理部
27 距離算出部
28 候補選択部
29 候補比較部
31 画像格納部
32 空間格納部
32 軌跡格納部
Claims (13)
- 当該文字種の1文字画像を複数の角度に回転して得た複数の回転文字画像から作成された固有空間を、複数の文字種について格納する空間格納部と、
前記複数の回転文字画像を対応する前記固有空間に投影して得た投影点の描く軌跡を、前記複数の文字種について格納する軌跡格納部と、
認識対象文字の画像を入力する入力部と、
前記認識対象文字の画像を前記固有空間に投影して得た前記認識対象文字の投影点と、前記複数の文字種についての軌跡の各々との距離を求める距離算出部と、
前記算出された距離に基づいて、前記認識対象文字の画像の候補を前記複数の文字種の中から選択する候補選択部とを備える
ことを特徴とする文字認識装置。 - 前記候補選択部が、前記算出された距離が最も短いものを1個だけ選択し、これを前記認識対象文字の文字種として決定する
ことを特徴とする請求項1記載の文字認識装置。 - 前記候補選択部が、前記認識対象文字の回転角度を決定する
ことを特徴とする請求項1記載の文字認識装置。 - 前記候補選択部が、前記認識対象文字の投影点と前記軌跡上の近接する2点を用いた所定の演算により、前記認識対象文字の回転角度を決定する
ことを特徴とする請求項3記載の文字認識装置。 - 前記候補選択部が、前記複数の回転文字画像の各々を文字認識についての意味を持つ十分な次元の固有空間に投影する
ことを特徴とする請求項1記載の文字認識装置。 - 当該文字認識装置が、更に、
当該文字種の1文字画像を複数の角度に回転して得た複数の回転文字画像を、前記複数の文字種について格納する画像格納部と、
前記画像格納部に格納された前記複数の回転文字画像から前記固有空間を、前記複数の文字種について作成し前記空間格納部に格納する空間作成部と、
前記画像格納部に格納された前記複数の回転文字画像を前記空間格納部に格納された当該複数の回転文字画像に対応する前記固有空間に投影して得た複数の投影点からなる軌跡を得て、当該軌跡を前記複数の文字種について前記軌跡格納部に格納する画像投影部とを備える
ことを特徴とする請求項1記載の文字認識装置。 - 当該文字認識装置が、更に、
前記複数の文字種について、前記画像投影部が求めた複数の投影点を補間する補間点を所定の処理により求める軌跡補間部を備え、
前記画像投影部が、前記軌跡補間部が求めた補間点を含む前記軌跡を、前記複数の文字種について前記軌跡格納部に格納する
ことを特徴とする請求項6記載の文字認識装置。 - 前記軌跡補間部は、前記画像投影部が求めた複数の投影点を周期スプラインを用いて補間するスプライン補間を行う
ことを特徴とする請求項7記載の文字認識装置。 - 前記軌跡補間部は、前記画像投影部が求めた複数の投影点及び前記軌跡補間部が求めた補間点についてその座標及び角度を格納するテーブルを備え、当該テーブルを用いて前記距離に加えて前記認識対象文字の回転角度を求める
ことを特徴とする請求項7記載の文字認識装置。 - 当該文字認識装置が、更に、
前記候補選択部により選択された候補を相互に比較して、前記認識対象文字の文字種を決定する候補比較部を備える
ことを特徴とする請求項1記載の文字認識装置。 - 前記候補比較部は、前記認識対象文字を所定の角度ずつ回転して複数の回転文字画像を得て、前記複数の回転文字画像を前記候補選択部により選択された候補に対応する固有空間に投影して複数の投影点を得て、前記候補選択部により選択された候補の中で前記複数の投影点に最も近いものを、前記認識対象文字の文字種とする
ことを特徴とする請求項10記載の文字認識装置。 - 当該文字種の1文字画像を複数の角度に回転して得た複数の回転文字画像から作成された固有空間を、複数の文字種について用意し、
前記複数の回転文字画像を対応する前記固有空間に投影して得た投影点の描く軌跡を、前記複数の文字種について用意し、
認識対象文字を入力し、
前記認識対象文字の画像を前記固有空間に投影して得た前記認識対象文字の投影点と、前記複数の文字種についての軌跡の各々との距離を求め、
前記算出された距離に基づいて、前記認識対象文字の画像の候補を前記複数の文字種の中から選択する
ことを特徴とする文字認識方法。 - 文字認識装置における文字認識方法を実現するプログラムであって、
前記プログラムは、コンピュータに、
当該文字種の1文字画像を複数の角度に回転して得た複数の回転文字画像から作成された固有空間と、前記複数の回転文字画像を対応する前記固有空間に投影して得た投影点の描く軌跡とを、前記複数の文字種について用意する処理と、
認識対象文字の画像を入力する処理と、
前記認識対象文字の画像を前記固有空間に投影して得た前記認識対象文字の投影点と、前記複数の文字種についての軌跡の各々との距離を求める処理と、
前記算出された距離に基づいて、前記認識対象文字の画像の候補を前記複数の文字種の中から選択する処理とを行わせる
ことを特徴とする文字認識プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003313367A JP2005084765A (ja) | 2003-09-05 | 2003-09-05 | 文字認識装置及び方法及びそのプログラム |
US10/786,083 US20050053282A1 (en) | 2003-09-05 | 2004-02-26 | Apparatus and method for character recognition and program thereof |
CA002459478A CA2459478A1 (en) | 2003-09-05 | 2004-03-02 | Apparatus and method for character recognition and program thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003313367A JP2005084765A (ja) | 2003-09-05 | 2003-09-05 | 文字認識装置及び方法及びそのプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005084765A true JP2005084765A (ja) | 2005-03-31 |
Family
ID=34225138
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003313367A Pending JP2005084765A (ja) | 2003-09-05 | 2003-09-05 | 文字認識装置及び方法及びそのプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20050053282A1 (ja) |
JP (1) | JP2005084765A (ja) |
CA (1) | CA2459478A1 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010092952A1 (ja) * | 2009-02-10 | 2010-08-19 | 公立大学法人大阪府立大学 | パターン認識装置 |
JP2017084299A (ja) * | 2015-10-30 | 2017-05-18 | 株式会社シーイーシー | 画像処理装置および画像処理方法 |
JP2020038495A (ja) * | 2018-09-04 | 2020-03-12 | 横浜ゴム株式会社 | 物性データ予測方法及び物性データ予測装置 |
JP7098070B1 (ja) * | 2021-05-21 | 2022-07-08 | 三菱電機株式会社 | 制御線ラベル及び制御線ラベルの文字認識方法 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7738672B2 (en) * | 2005-05-06 | 2010-06-15 | Grenning Albert R | Techniques for verifying the authenticity of the steel stamped information on an engine pad of a classic automobile and apparatus therefor |
US20070229538A1 (en) * | 2006-03-31 | 2007-10-04 | Research In Motion Limited | Methods and apparatus for dynamically labeling map objects in visually displayed maps of mobile communication devices |
JP5139716B2 (ja) * | 2007-05-16 | 2013-02-06 | キヤノン株式会社 | 画像検索装置及び画像検索方法 |
TWI384408B (zh) * | 2009-04-30 | 2013-02-01 | Ind Tech Res Inst | 影像辨識以及輸出方法與其系統 |
CN101882219B (zh) * | 2009-05-08 | 2013-09-11 | 财团法人工业技术研究院 | 图像辨识以及输出方法及其系统 |
CN106407976B (zh) * | 2016-08-30 | 2019-11-05 | 百度在线网络技术(北京)有限公司 | 图像字符识别模型生成和竖列字符图像识别方法和装置 |
JP7272200B2 (ja) * | 2019-09-17 | 2023-05-12 | 富士通株式会社 | 情報処理装置、情報処理プログラムおよび情報処理方法 |
CN112749690B (zh) * | 2020-03-27 | 2023-09-12 | 腾讯科技(深圳)有限公司 | 一种文本检测方法、装置、电子设备和存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01250184A (ja) * | 1987-12-09 | 1989-10-05 | Ricoh Co Ltd | 文字認識方法及び文字の回転角度判定方法 |
JP2000123186A (ja) * | 1998-10-14 | 2000-04-28 | Canon Inc | 被写体認識装置 |
JP2002140706A (ja) * | 2000-11-01 | 2002-05-17 | Mitsubishi Heavy Ind Ltd | 画像識別装置および画像データ処理装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3854024B2 (ja) * | 1999-11-30 | 2006-12-06 | 株式会社Pfu | 文字認識前処理装置及び方法並びにプログラム記録媒体 |
US7174043B2 (en) * | 2003-02-25 | 2007-02-06 | Evernote Corp. | On-line handwriting recognizer |
-
2003
- 2003-09-05 JP JP2003313367A patent/JP2005084765A/ja active Pending
-
2004
- 2004-02-26 US US10/786,083 patent/US20050053282A1/en not_active Abandoned
- 2004-03-02 CA CA002459478A patent/CA2459478A1/en not_active Abandoned
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01250184A (ja) * | 1987-12-09 | 1989-10-05 | Ricoh Co Ltd | 文字認識方法及び文字の回転角度判定方法 |
JP2000123186A (ja) * | 1998-10-14 | 2000-04-28 | Canon Inc | 被写体認識装置 |
JP2002140706A (ja) * | 2000-11-01 | 2002-05-17 | Mitsubishi Heavy Ind Ltd | 画像識別装置および画像データ処理装置 |
Non-Patent Citations (4)
Title |
---|
坂野鋭、武川直樹: "AICによる部分空間次元数の決定法", 電子情報通信学会技術研究報告, vol. 97, no. 387, CSNG200202308022, 1997, JP, pages 159 - 166, ISSN: 0000877303 * |
村瀬洋、ナイヤー シュリー: "2次元照合による3次元物体認識", 電子情報通信学会論文誌, vol. 第11号, 1994, CSNG199800739004, 1994, JP, pages 2179 - 2187, ISSN: 0000877302 * |
村瀬洋: "パラメトリック固有空間法による画像認識", 電子情報通信学会誌, vol. 第85巻 第4号, CSNG200400435005, 2002, JP, pages 252 - 258, ISSN: 0000877300 * |
村瀬洋: "古くて新しい画像認識法", 情報処理, vol. 第38巻 第1号, CSNG199700252009, 1997, JP, pages 54 - 60, ISSN: 0000877301 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010092952A1 (ja) * | 2009-02-10 | 2010-08-19 | 公立大学法人大阪府立大学 | パターン認識装置 |
US8422793B2 (en) | 2009-02-10 | 2013-04-16 | Osaka Prefecture University Public Corporation | Pattern recognition apparatus |
JP5522408B2 (ja) * | 2009-02-10 | 2014-06-18 | 公立大学法人大阪府立大学 | パターン認識装置 |
JP2017084299A (ja) * | 2015-10-30 | 2017-05-18 | 株式会社シーイーシー | 画像処理装置および画像処理方法 |
JP2020038495A (ja) * | 2018-09-04 | 2020-03-12 | 横浜ゴム株式会社 | 物性データ予測方法及び物性データ予測装置 |
JP7218519B2 (ja) | 2018-09-04 | 2023-02-07 | 横浜ゴム株式会社 | 物性データ予測方法及び物性データ予測装置 |
JP7098070B1 (ja) * | 2021-05-21 | 2022-07-08 | 三菱電機株式会社 | 制御線ラベル及び制御線ラベルの文字認識方法 |
WO2022244223A1 (ja) * | 2021-05-21 | 2022-11-24 | 三菱電機株式会社 | 制御線ラベル及び制御線ラベルの文字認識方法 |
Also Published As
Publication number | Publication date |
---|---|
US20050053282A1 (en) | 2005-03-10 |
CA2459478A1 (en) | 2005-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4594372B2 (ja) | ドキュメント画像からのパラメータ化された形状の認識方法 | |
JP2669583B2 (ja) | 手書き認識のためのコンピュータベース方法及びシステム | |
US7369702B2 (en) | Template-based cursive handwriting recognition | |
Baird | Feature identification for hybrid structural/statistical pattern classification | |
US20080002884A1 (en) | Method and device for recognition of a handwritten pattern | |
JPS6282486A (ja) | オンライン手書き図形認識装置 | |
JPH05217025A (ja) | オンライン手書き文字認識装置および方法 | |
CN110717492B (zh) | 基于联合特征的图纸中字符串方向校正方法 | |
Taxt et al. | Recognition of handwritten symbols | |
JP2005084765A (ja) | 文字認識装置及び方法及びそのプログラム | |
US20050058339A1 (en) | Data recognition device | |
Bogacz et al. | Character retrieval of vectorized cuneiform script | |
CN112966685A (zh) | 用于场景文本识别的攻击网络训练方法、装置及相关设备 | |
CN111598087A (zh) | 不规则文字的识别方法、装置、计算机设备及存储介质 | |
JPH08167000A (ja) | 文字認識装置および方法 | |
JP2007213433A (ja) | 文字検索装置 | |
CN109886091B (zh) | 基于带权重局部旋度模式的三维人脸表情识别方法 | |
Hase et al. | Recognition of Rotated Characters by Eigen-space. | |
Kumar et al. | Bayesian background models for keyword spotting in handwritten documents | |
US20070172132A1 (en) | Pictographic recognition technology applied to distinctive characteristics of handwritten arabic text | |
Zhang et al. | Multiview facial landmark localization in RGB-D images via hierarchical regression with binary patterns | |
CN111310548B (zh) | 一种在线手写笔迹中笔画类型的识别方法 | |
CN106326903A (zh) | 一种基于仿射尺度不变特征和稀疏表示的典型目标识别方法 | |
Rashid | Optical Character Recognition-A Combined ANN/HMM Approach | |
Baloch et al. | Flexible skew-symmetric shape model for shape representation, classification, and sampling |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051104 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070731 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080520 |