JP4686433B2 - 単語認識方法および単語認識装置 - Google Patents

単語認識方法および単語認識装置 Download PDF

Info

Publication number
JP4686433B2
JP4686433B2 JP2006280413A JP2006280413A JP4686433B2 JP 4686433 B2 JP4686433 B2 JP 4686433B2 JP 2006280413 A JP2006280413 A JP 2006280413A JP 2006280413 A JP2006280413 A JP 2006280413A JP 4686433 B2 JP4686433 B2 JP 4686433B2
Authority
JP
Japan
Prior art keywords
character
word
calculation
recognition
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006280413A
Other languages
English (en)
Other versions
JP2008097452A (ja
Inventor
倫行 浜村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2006280413A priority Critical patent/JP4686433B2/ja
Priority to EP07792960A priority patent/EP2088537A4/en
Priority to PCT/JP2007/066431 priority patent/WO2008044393A1/ja
Priority to KR1020097007460A priority patent/KR101065152B1/ko
Publication of JP2008097452A publication Critical patent/JP2008097452A/ja
Priority to US12/419,512 priority patent/US20090190841A1/en
Application granted granted Critical
Publication of JP4686433B2 publication Critical patent/JP4686433B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/768Arrangements for image or video recognition or understanding using pattern recognition or machine learning using context analysis, e.g. recognition aided by known co-occurring patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/226Character recognition characterised by the type of writing of cursive writing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19173Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • G06V30/268Lexical context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Character Discrimination (AREA)

Description

本発明は、たとえば、被読取物上に記載された複数の文字からなる単語を光学的に読取る光学的文字読取装置などにおいて単語認識を行う単語認識方法、および、その単語認識処理を行わせるための単語認識プログラムに関する。
一般に、たとえば、光学的文字読取装置において、被読取物上に記載された文字を読取る場合、個々の文字認識精度が低くても、単語の知識を用いることで精度良く読取ることができる。従来、その実施方法として種々の方法が提案されている。
その中で、単語の評価値として事後確率(a posteriori probability)を用い、かつ文字数が一定でない場合においても精度良く単語認識が行える方法として、特許文献1に開示されるものがある。
特開2001−283157号公報
しかしながら、特許文献1に開示されるものは、単語の評価値である事後確率の近似計算における誤差が大きく、リジェクトを行うにあたり不都合が生じる。リジェクトは事後確率が一定値以下であった場合に行うのが最適であるが、特許文献1の技術では誤差によりリジェクトに失敗する可能性がある。そのため、特許文献1の技術を用いてリジェクトを行う場合は、他の単語の評価値との差を見ることで、リジェクトを行っている。しかし、この方法はヒューリスティックであり、最適であるとは言えない。
そこで本発明は、事後確率の近似計算における誤差を抑え、精度良くリジェクトを行える単語認識方法および単語認識装置を提供することを目的とする。
本発明の単語認識方法は、認識すべき単語に対応した入力文字列を各文字ごとに認識処理を行うことにより文字認識結果を得る文字認識処理ステップと、あらかじめ認識すべき単語の候補が格納されている単語辞書内の各単語の各文字を条件として上記文字認識処理ステップにより文字認識結果として得られた特徴が出現する確率を求める確率算出ステップと、この確率算出ステップにより求めた確率と上記文字認識処理ステップにより文字認識結果として得られた特徴が出現する確率との間で除算を行う第1の演算ステップと、上記除算により上記単語辞書内の各単語の各文字に対してそれぞれ求めた各演算結果の間で乗算を行う第2の演算ステップと、上記乗算により上記単語辞書内の各単語に対してそれぞれ求めた各演算結果を全て足し合わせる第3の演算ステップと、上記乗算により上記単語辞書内の各単語に対してそれぞれ求めた各演算結果を第3の演算ステップの演算結果で割る第4の演算ステップと、この第4の演算ステップによる演算結果の最大値が所定のしきい値以下の場合は認識結果をリジェクトとし、前記所定のしきい値を超える場合は最大値となる単語を認識結果とする単語認識処理ステップとを具備している。
また、本発明の単語認識方法は、認識すべき単語に対応した入力文字列を各文字ごとに切出す切出しステップと、この切出しステップによる文字切出しによって、文字間が接しているかあるいは文字間が離れているかを考慮した複数種類の切出し結果を求めるステップと、このステップにより求めた全ての切出し結果の各文字に対してそれぞれ認識処理を行う文字認識処理ステップと、あらかじめ認識すべき単語の候補が格納されている単語辞書内の各単語の各文字を条件として上記文字認識処理ステップにより文字認識結果として得られた特徴が出現する確率を求める確率算出ステップと、この確率算出ステップにより求めた確率と上記文字認識処理ステップにより文字認識結果として得られた特徴が出現する確率との間で除算を行う第1の演算ステップと、上記除算により上記単語辞書内の各単語の各文字に対してそれぞれ求めた各演算結果の間で乗算を行う第2の演算ステップと、上記乗算により上記単語辞書内の各単語に対してそれぞれ求めた各演算結果を全て足し合わせる第3の演算ステップと、上記乗算により上記単語辞書内の各単語に対してそれぞれ求めた各演算結果を第3の演算ステップの演算結果で割る第4の演算ステップと、この第4の演算ステップによる演算結果の最大値が所定のしきい値以下の場合は認識結果をリジェクトとし、前記所定のしきい値を超える場合は最大値となる単語を認識結果とする単語認識処理ステップと、を具備している。
また、本発明の単語認識装置は、認識すべき単語に対応した入力文字列を各文字ごとに認識処理を行うことにより文字認識結果を得る文字認識処理手段と、あらかじめ認識すべき単語の候補が格納されている単語辞書内の各単語の各文字を条件として上記文字認識処理手段により文字認識結果として得られた特徴が出現する確率を求める確率算出手段と、この確率算出手段により求めた確率と上記文字認識処理手段により文字認識結果として得られた特徴が出現する確率との間で除算を行う第1の演算手段と、上記除算により上記単語辞書内の各単語の各文字に対してそれぞれ求めた各演算結果の間で乗算を行う第2の演算手段と、上記乗算により上記単語辞書内の各単語に対してそれぞれ求めた各演算結果を全て足し合わせる第3の演算手段と、上記乗算により上記単語辞書内の各単語に対してそれぞれ求めた各演算結果を第3の演算手段の演算結果で割る第4の演算手段と、この第4の演算手段による演算結果の最大値が所定のしきい値以下の場合は認識結果をリジェクトとし、前記所定のしきい値を超える場合は最大値となる単語を認識結果とする単語認識処理手段と、を具備したことを特徴とする。
この発明によれば、事後確率の近似計算における誤差を抑え、精度良くリジェクトを行える単語認識方法および単語認識装置を提供できる。
以下、本発明の実施の形態について図面を参照して説明する。
図1は、本発明の実施の形態に係る単語認識方法を実現するための単語認識システムの構成を概略的に示すものである。
図1において、この単語認識システムは、CPU(セントラル・プロセッシング・ユニット)1、入力装置2、画像入力手段としてのスキャナ3、表示装置4、記憶手段としての第1メモリ5、記憶手段としての第2メモリ6、および、読取装置7などによって構成されている。
CPU1は、第2メモリ6に格納されたオペレーティングシステムプログラム、および、第2メモリ6に格納されたアプリケーションプログラム(単語認識プログラムなど)を実行することにより、後で詳細を説明するような単語認識処理などを行うものである。
入力装置2は、たとえば、キーボードやマウスなどからなり、利用者が各種操作を行ったり、各種データを入力するために使用される。
スキャナ3は、被読取物上に記載された単語の各文字を光学的な走査により読取って入力するものである。上記被読取物としてはたとえば宛名が記載されている郵便物Pであり、上記宛名の記載方法として、図2に示すように、1番下の行から順にしかも右側から順に郵便番号、州名、都市名、ストリート名、ストリート番号の順に記載されるようになっている。
表示装置4は、たとえば、ディスプレイ装置やプリンタなどからなり、各種データを出力するものである。
第1メモリ5は、たとえば、RAM(ランダム・アクセス・メモリ)により構成されていて、CPU1の作業用メモリとして使用され、処理中の各種データなどを一時記憶するものである。
第2メモリ6は、たとえば、ハードディスク装置により構成されていて、CPU1を動作させるための各種プログラムなどを記憶するものである。第2メモリ6には、入力装置2、スキャナ3、表示装置4、第1メモリ5、第2メモリ6、読取装置7などを動作させるためのオペレーティングシステムプログラム、単語認識プログラムおよび単語を構成する文字の認識用の文字辞書9、単語認識用の単語辞書10、単語を構成する文字の出現確率を記憶している確率テーブル11などが記憶されている。上記単語辞書10としては、あらかじめ認識すべき単語の候補が複数格納されているものであり、単語認識システムが設置されている地域たとえば州における都市名が登録されている都市名辞書となっている。
読取装置7は、たとえば、CD−ROMドライブ装置などからなり、記憶媒体としてのCD−ROM8に格納(記憶)されている単語認識プログラムおよび単語認識用の単語辞書10などを読取るものである。読取装置7により読取られた単語認識プログラム、文字辞書9、単語辞書10、確率テーブル11は、第2メモリ6に格納(記憶)される。
次に、単語認識方法の概略について、図3に示すフローチャートを参照しつつ説明する。
まず、スキャナ3により郵便物Pの画像を取り込む(読取る)画像取り込み処理が行われる(ST1)。この画像取り込み処理により取り込んだ画像により宛名の記載されている領域を検出する領域検出処理が行われる(ST2)。この領域検出処理により検出した宛名の記載領域から都市名に対応する単語の1文字ずつの矩形領域の文字パターンを、垂直射影や水平射影を用いて切出す切出し処理が行われる(ST3)。この切出し処理により切出された単語の1文字ずつの文字パターンと文字辞書9に記憶されている文字パターンとを比較して得られる類似度により文字の認識候補を得る文字認識処理が行われる(ST4)。この文字認識処理により得られる単語の1文字ずつの認識結果と単語辞書10に記憶されている都市名の各文字と確率テーブル11とを用いて、単語辞書10の各都市名ごとの事後確率を算出し、事後確率の一番大きなものを単語として認識する単語認識処理が行われる(ST5)。上記各処理はCPU1により制御されている。
上記ステップ3により文字パターンの切出し処理が行われる際に、1文字ずつの文字パターンと文字パターンのすき間の大きさにより、単語の切れ目を判断するものであっても良い。また、そのすき間の大きさにより、文字の接触、文字の分離を判断するものであっても良い。
本発明の実施の形態に係る単語認識方法は、このようなシステム構成において実現されるものであるが、まず概要について説明する。
1.概要
たとえば、光学的文字読取装置による文字読取りを考える。文字認識の性能が高く、ほとんど読み間違えないのならば問題はないが、たとえば、手書文字の認識ではそこまでの性能を得るのが難しい。そこで、単語の知識を用いることで認識精度を高める。具体的には、単語の辞書の中から正しいと考えられる単語を選び出す。そのために、各単語ごとに何らかの評価値を計算し、最も高い(低い)評価値をとった単語を認識結果とすることになる。評価関数として、従来は前述したような各種のものが考えられているが、前述したような各種問題がある。
そこで、本実施の形態では、評価関数として前述した各種問題を考慮した事後確率を用いる。これにより、文字数の違い、単語切出しの曖昧さ、文字接触、ノイズ、文字分離までを全て確率の計算により1つの評価関数に自然に組込むことができる。
次に、本発明で用いるベイズ推定(Bayes Estimation)の一般論について説明する。
2.ベイズ推定の一般論
入力パターン(入力文字列)をxとする。認識処理とは、xに対しある処理を行い、分類結果が得られるものである。これを分解して考えてみると、以下の2つのプロセスに分けることができる。
(1) xについて何らかの特徴量を得る特徴抽出処理Rをかけることで、「特徴」r(=R(x))を得る。
(2) 「特徴」rを見てそこに何らかの評価法を用い、分類結果ki を得る。
分類結果ki が「認識結果」である。単語認識においては、「特徴」の1つとして文字認識の「認識結果」が使われるので注意が必要である。今後、用語としての「特徴」と「認識結果」を区別して用いる。
ベイズ推定は、2番目のプロセスにおける評価法として用いられる。事後確率P(ki |r)が最大となるカテゴリki を認識結果とする。事後確率P(ki |r)を直接計算するのが困難、もしくは不可能である場合、ベイズの定理、
Figure 0004686433
を用いて間接的に計算する。分母のP(r)はiによらない定数であるため、分子のP(r|ki )P(ki )を計算することで、事後確率P(ki |r)の大小を評価することができる。
次に、以後の説明の理解を容易にするため、文字数が一定であった場合の単語認識におけるベイズ推定について説明する。この場合のベイズ推定は、英語などの、単語を分けて書く言語において有用である。
3.文字数一定の場合のベイズ推定
3.1.定式化
文字の切出し、単語の切出しが完全に成功しており、また文字間のノイズの混入もなく、文字数が確定していると仮定する。次のように定義する。
Figure 0004686433
このとき、ベイズ推定によって書かれている単語を推定することを考える。
Figure 0004686433
P(r|ki )は次のように表わされる。
Figure 0004686433
P(ki )は統計的に求まっているものとする。たとえば、郵便物の宛名読取りの場合、宛先の統計だけでなく、書状内での位置、行内での位置などに依存することも考えられる。
なお、P(r|ki )は積で表わされているが、これに限らず、たとえば、対数をとり、加算に変換することも可能である。以下の説明においても同じことが言える。
3.2.実用に向けた近似
特徴ri として何を用いるかにより、認識の性能に大きな違いがでる。
3.2.1. 1位候補を用いた場合
文字特徴ri として「1位候補の文字」を用いることを考えてみる。次のように定義する。
・文字集合C={ci }
例 ci :数字、ci :アルファベット大文字小文字など
・文字特徴集合E={ei }
ei =(1位候補がci )
・ri ∈E
たとえば、文字集合Cとして、「アルファベット大文字小文字+数字」を想定すると、特徴ei の種類も文字ci の種類もn(C)=n(E)=62通りであるため、(ei ,cj )の組合わせは「62」の二乗通りであり、「62」の二乗通りのP(ei |cj )をあらかじめ用意しておくことで、上記式(3)は計算される。具体的には、たとえば、P(ei |″A″)を求めるには、″A″のサンプルをたくさん特徴抽出処理Rに流し、各特徴ei の出現頻度を調べればよい。
3.2.2.近似
ここで、次のような近似を用いることも考えられる。
Figure 0004686433
Figure 0004686433
上記式(4)、式(5)は、どの文字ci でも、1位候補がその文字自体になる確率は等しくpであり、それ以外の文字になる確率は等しくqである、という近似である。このとき、
p+{n(E)−1}q=1
式(6)
が成り立っている。
この近似は、1位候補を並べた文字列を仮の認識結果とし、その文字列と各ワードwaが何文字一致しているかを見るマッチングと対応している。aの数の文字が一致したとき(a個の文字が一致したとき))、
Figure 0004686433
と表わされ、簡便である。
3.3.具体例
たとえば、図2に示すような、英語で書かれた郵便物Pの宛名読取りにおいて、都市名を読むことを考える。図4は、上述した切出し処理により切出された都市名が書かれていると考えられる部分に対応する文字パターンの切出し処理結果であり、4つの文字であることが検出されている。単語辞書10としては文字数ごとの都市名(単語)の候補が格納されており、たとえば、4つの文字からなる都市名(単語)の候補が、図5により示されている。この場合、4つの文字数の都市名として、「MAIR」(k1)、「SORD」(k2)、「ABLA」(k3)、「HAMA」(k4)、「HEWN」(k5)の5つが格納されている。
図4の各文字パターンに対して上述した文字認識処理により文字認識を行う。この各文字パターンごとの文字認識結果を基に、図5の各都市名ごとの事後確率を計算する。
計算に用いる特徴(=文字認識結果)は様々であるが、ここでは1位候補の文字を用いた例を示す。この場合、図4の各文字パターンに対して、文字認識結果が左の文字から順に「H、A、I、A」となっている。実際に書かれている文字列が「MAIR」(k1)であったとき、図4の文字認識結果「H、A、I、A」が生じる確率P(r|k1 )は、上記式(3)より、
Figure 0004686433
である。3.2.1節で述べたように、あらかじめ右辺の各項の値は求めておき、確率テーブル11として用意しておく。もしくは、3.2.2節で述べた近似を用いれば、たとえば、p=0.5、n(E)=26のときは、q=0.02であるから、
P(r|k1 )=q・p・p・q=0.0001
式(9)
が算出される。
すなわち、実際に書かれている文字列が「MAIR」(k1)であったとき、図4の文字認識結果「H、A、I、A」が生じる確率P(r|k1 )は、「0.0001」となる。
同様にして
P(r|k2 )=q・q・q・q=0.00000016
P(r|k3 )=q・q・q・p=0.000004
P(r|k4 )=p・p・q・p=0.0025
P(r|k5 )=p・q・q・q=0.000004
式(10)
すなわち、実際に書かれている文字列「SORD」(k2)であったとき、図4の文字認識結果「H、A、I、A」が生じる確率P(r|k2 )は、「0.00000016」となる。
実際に書かれている文字列「ABLA」(k3)であったとき、図4の文字認識結果「H、A、I、A」が生じる確率P(r|k3 )は、「0.000004」となる。
実際に書かれている文字列「HAMA」(k4)であったとき、図4の文字認識結果「H、A、I、A」が生じる確率(r|k2 )は、「0.00000016」となる。
実際に書かれている文字列「HEWN」(k5)であったとき、図4の文字認識結果「H、A、I、A」が生じる確率P(r|k5 )は、「0.000004」となる。
P(k1 )〜P(k5 )を等しいと見なせば、上記式(2)より事後確率P(ki |r)の大小はP(r|ki )と同じである。したがって、上記式(9)、式(10)の大小を比較すればよく、最も大きいのはP(r|k4 )であるので、図2に書かれている都市名は「HAMA」であると推定される。
ここで、確率テーブル11の説明をしておく。
図6は、3.2.2節で述べた近似を確率テーブルの形で表したものである。文字種は、アルファベットの大文字26種であるとする。
縦軸が実際に書かれている文字であり、横軸がその文字認識結果である。
例えば、確率テーブル11において、縦軸の”M”と横軸”H”の交点は、実際に書かれている文字が”M”であったときに文字認識結果が”H”となる確率P(”H”|”M”)である。
3.2.2節の近似では、文字認識結果が実際に書かれている文字自体になる確率を等しくpとしているため、確率テーブル11の左上から右下にかけての対角線上は全て等しくなる。図6では確率は0.5である。
また、3.2.2節の近似では、文字認識結果が実際に書かれている文字と異なる確率を等しくqとしているため、確率テーブル11の左上から右下にかけての対角線上以外の部分は、全て等しくなる。図6では確率は0.02である。
3.2.2節の近似を用いた結果、図4の文字認識結果と図5の単語辞書10の各都市名の間で一致している文字数が多い都市名が選ばれることになっている。3.2.2節の近似を用いず、3.2.1節で述べたように、あらかじめ各P(ei |cj )を求めて、それを計算に用いた場合、一致した文字数が多ければよいとは限らない。
たとえば、上記式(8)の第1項は、「H」と「M」は形状が似ていることから比較的大きい値であり、
Figure 0004686433
とする。また、第4項も同様であり、
Figure 0004686433
であるとする。確率テーブル11は図7のようになる。他の文字に関しては、3.2.2節の近似が成り立つとする。このとき、
Figure 0004686433
であり、P(r|k1 )が最も大きな値となり、図2の郵便物Pに書かれていると推定される都市名は「MAIR」となる。
次に、本発明の第1の実施の形態としての、文字数が一定でない場合の単語認識におけるベイズ推定について説明する。この場合のベイズ推定は、日本語などの、単語を分けて書かない言語において有用である。また、単語を分けて書く言語においても、単語辞書に複数単語からなる文字列がある場合は有用である。
4.文字数が一定でない場合のベイズ推定
実際には、複数単語の文字列がカテゴリに含まれる場合(例:NORTH YORK)もあるが、3節で述べた方法では1単語の文字列と2単語の文字列での比較はできない。また、単語を分けて書かない言語(日本語など)では文字数が一定とならず、3節の方法は使えない。そこで、本節では文字数が一定とは限らない場合に対応した単語認識方法を説明する。
4.1.定式化
入力パターンxを、1単語ではなく、複数単語とし、3節と同様にベイズ推定を行う。この場合、3節の定義を次のように追加変更する。
変更
・入力パターンxを複数単語とする。
・L:入力パターンx内の全文字数
・カテゴリ集合K={ki }
Figure 0004686433
追加
Figure 0004686433
このとき、ベイズ推定を用いると、事後確率P(ki |r)は、上記式(2)と同じである。
Figure 0004686433
P(r|ki )は次のように表わされる。
Figure 0004686433
P(ki )は、3節と同様に求まっているものとする。n(K)は、3節よりも増えるため、単純にはP(ki )は3節よりも小さな値となることに注意する。
4.2.実用に向けた近似
4.2.1.文字列のない部分に対する近似と文字数正規化(Normalization)
上記式(13)の第1項を次のように近似する。
Figure 0004686433
1行目の近似は、「入力パターンxの全文字のうち文字列wbが当てはまっていない部分への、wbによる影響を無視する」というものである。2行目は、「各rk が独立である」というものである。実際にはそうではなく、粗い近似ではあるが、非常に有効である。
同様に、上記式(13)の第3項も近似すると、上記式(13)は次のようになる。
Figure 0004686433
ここで、P(ki |r)/P(ki )という値を考える。これは、ki である確率が、特徴rを知ることでどれほど増減したかを示す値である。
Figure 0004686433
上記式(16)の2行目の分母で用いている近似は、上記式(14)と同様である。
この結果は非常に重要である。上記式(16)の右辺には、全文字のうち文字列wbが当てはまっていない部分に関する記述はない。すなわち、上記式(16)は、入力パターンxが何であるかに無関係である。このことから、文字列wbの位置、長さは気にせずに上記式(16)を計算し、P(ki )をかけることで、P(ki |r)を計算できることがわかる。
上記式(16)の分子を見ると、上記式(3)、つまり文字数を一定とした場合のP(r|ki )と同じ式になっている。これは、上記式(16)は分母によって文字数の正規化を行っているといえる。
4.2.2. 1位候補を用いた場合
ここで、特徴として3.2.1節のように「1位候補の文字」を用いたとする。すると、P(rk )の近似として次のものが考えられる。
Figure 0004686433
実際には、各文字の生起確率を考慮する必要があり、それを無視したものである。このとき、3.2.2節の近似も用いて上記式(16)を近似すると、次の式となる。
Figure 0004686433
n(E)Ljにより正規化がなされている。
4.2.3.誤差の抑制
上記式(16)は粗い近似の元に導かれた式であり、精度に問題の起こることがある。そこで、より精度を高めるため、上記式(12)からの式変形を以下のように行う。
Figure 0004686433
但し、
Figure 0004686433
とする。
これにより、上記式(16)の2行目の分母で用いていた近似を回避することができ、誤差が抑制される。
match(ki )は上記式(16)の3行目と同じ式である。つまり、各ki について上記式(16)を計算し、それを代入することで、上記式(16−2)は計算される。
4.3.具体例
たとえば、郵便物の宛名読取りにおいて、都市名を読むことを考える。
・単語を分けて書く言語(英語など)であり、複数単語の都市名が存在するとき
・単語を分けて書かない言語(日本語など)のとき
以上のとき、各候補の文字数は一定にはならない。例として、図8に示すような、英語で書かれた郵便物Pの宛名読取りにおいて、都市名を読むことを考える。図9は、上述した切出し処理により切出された都市名が書かれていると考えられる部分に対応する文字パターンの切出し処理結果であり、2文字単語の後、スペースが空いて、その後に3文字の単語が存在することが検出されている。単語辞書10としては、図10に示すように、図9に当てはまる文字数、単語数を持つ都市名が全て格納されている。この場合、都市名として、「COH」(k1)、「LE ITH」(k2)、「OTH」(k3)、「SK」(k4)、「ST LIN」(k5)の5つが格納されている。
図9の各文字パターンに対して上述した文字認識処理により文字認識を行う。この各文字パターンごとの文字認識結果を基に、図10の各都市名ごとの事後確率を計算する。
計算に用いる特徴(=文字認識結果)は様々であるが、ここでは1位候補の文字を用いた例を示す。この場合、図9の各文字パターンに対して、文字認識結果が左の文字から順に「S、K、C、T、H」となっている。文字認識結果が「S、K、C、T、H」であったとき、実際には、右の3文字に「COH」が書かれているという確率P(ki |r)は、4.2.1節で述べた近似を用いると、上記式(16)により、
Figure 0004686433
から計算できる。さらに、3.2.2節、4.2.2節で述べた近似を用いれば、たとえば、p=0.5、n(E)=26のときは、q=0.02であるから、
Figure 0004686433
同様にして
Figure 0004686433
ただし、k3 は右3文字が「OTH」であり、k4 は左2文字が「SK」であるとしたものである。
P(k1 )〜P(k5 )を等しいと見なせば、事後確率P(ki |r)の大小は上記式(20)、式(21)の大小を比較すればよく、最も大きいのはP(k4 |r)であるので、図8に書かれている都市名は「SK」であると推定される。
3.2.2節の近似を用いず、3.2.1節で述べたように、あらかじめ各P(ei |cj )を求めて、それを計算に用いた場合の例もあげておく。
「C」と「L」、「T」と「I」、「H」と「N」の形状が似ていることから、
Figure 0004686433
であるとし、他の文字に関しては、3.2.2節の近似が成り立つとする。確率テーブル11は図11のようになる。このとき、
Figure 0004686433
であり、P(k5 |r)/P(k5 )が最も大きな値となり、図8に書かれていると推定される都市名は「ST LIN」となる。
また、4.2.3節で述べたような、誤差を抑制する計算の例も示しておく。上記式(16−2)を計算する。P(k1 )〜P(k5 )は等しいとみなし、約分しておく。分母は上記式(22)の総和であり、56.24+15.21+56.24+169+205.3≒502である。分子は上記式(22)の各々の結果である。よって、
Figure 0004686433
となり、確率0.5以下の時はリジェクトとすることにすると、認識結果はリジェクトとなる。
このように、第1の実施の形態では、認識すべき単語に対応した入力文字列を各文字ごとに認識処理を行い、あらかじめ認識すべき単語の候補が格納されている単語辞書内の各単語の各文字を条件として文字認識結果として得られた特徴が出現する確率を求め、この求めた確率を文字認識結果として得られた特徴が出現する確率で除算し、単語辞書内の各単語の各文字に対してそれぞれ求めた上記各除算結果を全ての文字について乗算し、単語辞書内の各単語に対してそれぞれ求めた上記乗算結果を全て加算し、単語辞書内の各単語に対してそれぞれ求めた上記乗算結果を上記加算結果で除算し、この結果に基づき上記単語の認識結果を得るものである。
すなわち、文字認識結果を用いた単語認識において、単語の文字数が一定とは限らない場合にも用いることのできる、事後確率を基にした評価関数を用いることにより、単語の文字数が一定でない場合においても精度良く単語認識が行える。
また、リジェクト処理も精度良く行える。
次に、本発明の第2の実施の形態としての、単語切出しが曖昧であるとき、その曖昧さまで事後確率の計算に含めたベイズ推定について説明する。この場合のベイズ推定は、単語切れ目の誤検出が無視できないときに有用となる。
5.単語切出しの統合
単語を分けて書く言語(英語など)においては、4節までで述べた方法では、単語が必ず正しく切出されているという前提があり、これが満たされず文字数に変化があると対応できない。そこで、本節では、単語切出しの結果を絶対とせず、確率として扱うことで、単語切出しの曖昧さを単語認識におけるベイズ推定に統合する。4節との大きな違いは、単語切出しの結果として得られる文字間の特徴を考慮していることである。
5.1.定式化
ここでも文字の切出しは完全に成功しており、ノイズの混入もないとする。4節の定義を基に次のように追加変更する。
変更
・入力パターンxを行とする。
・L:入力行x内の全文字数
・カテゴリ集合K={ki }
Figure 0004686433
追加
Figure 0004686433
変更
・特徴r=(rc ,rs )
rc :文字特徴、rs :文字間特徴
追加
Figure 0004686433
このとき、事後確率P(ki |r)は以下の式で表わされる。
Figure 0004686433
ここで、P(rs |ki )とP(rc |ki )が独立であると仮定すると(これは文字特徴抽出と文字間特徴抽出が独立であることを意味する)、P(rc |rs ,ki )=P(rc |ki )であるから、上記式(23)は以下のようになる。
Figure 0004686433
P(rc |ki )は、上記式(13)とほぼ同様である。
Figure 0004686433
P(rs |ki )は次のように表わされる。
Figure 0004686433
P(ki )は、4節までと同様に求まっているものとする。ただし、一般にn(K)は4節のときよりも大幅に増えることに注意する。
5.2.実用に向けた近似
5.2.1.文字列のない部分に対する近似と文字数正規化
4.2.1節と同様の近似を上記式(25)に用いると次のようになる。
Figure 0004686433
同様に、上記式(26)は次のように近似される。
Figure 0004686433
4.2.1節と同様、P(ki |r)/P(ki )という値を考えると、以下のように変形される。
Figure 0004686433
上記式(29)の1行目は、上記式(24)による。2行目は、
Figure 0004686433
という近似を用いている。上記式(29)は、「ki である確率の、『特徴』を知ることによる変化」はrc とrs で独立に扱えることを示している。以下にそれぞれを計算する。
Figure 0004686433
Figure 0004686433
上記式(30)、式(31)の2行目の分母で用いている近似は、上記式(14)と同様である。なお、式(31)の3行目において、rs0,rsLは必ず行先頭、最後尾《次節5.2.2の例ではd3 》であるので、P(rs0)=P(rsL)=1である。
以上より、
Figure 0004686433
上記式(16)と同様、上記式(32)も文字列wcの当てはまらない部分に関する記述はない。すなわち、この場合も「分母による正規化」の考え方ができる。
5.2.2.文字間特徴rs の一例
例として次のように定義する。
・文字間特徴集合D={d0 ,d1 ,d2 (,d3 )}
d0 :文字間が広い
d1 :文字間が狭い
d2 :接触している
(d3 :行の先頭または最後尾であり、必ず単語切れ目である)
・rs ∈D
このとき、
Figure 0004686433
をあらかじめ求めておくことで、上記式(32)の第2項分子
Figure 0004686433
を求めることができる。ただし、P(d3 |s2 )=1である。
また、
Figure 0004686433
を求めておくことで、上記式(32)の第2項分母P(rsk)を求めることができる。
5.2.3.誤差の抑制
上記式(32)は粗い近似の元に導かれた式であり、精度に問題の起こることがある。そこで、より精度を高めるため、上記式(23)からの式変形を以下のように行う。
Figure 0004686433
但し、
Figure 0004686433
とする。
これにより、上記式(30)の2行目の分母、上記式(31)の2行目の分母で用いていた近似を回避することができ、誤差が抑制される。
matchB(ki)は上記式(32)と同じ式である。つまり、各kiについて上記式(32)を計算し、それを代入することで、上記式(23−2)は計算される。
5.3.具体例
4.3節と同様に、英語の郵便物の宛名読取りにおいて、都市名を読むことを考える。
たとえば、図12に示すような、英語で書かれた郵便物Pの宛名読取りにおいて、都市名を読むことを考える。図13は、上述した切出し処理により切出された都市名が書かれていると考えられる部分に対応する文字パターンの切出し処理結果であり、全部で5文字であることが検出されている。1−2文字目は接触しており、2−3文字目の間は広く、3−4文字目の間、4−5文字目の間は狭いことが検出されている。図14(a)から(c)は単語辞書10の内容であり、全ての都市名が格納されている。この場合、都市名として、図14(a)に示す、「ST LIN」、図14(b)に示す、「SLIM」、図14(c)に示す、「SIM」の3つが格納されている。各都市名の下に記載された記号(s0 ,s1 )は単語切れ目か否かを示すものであり、s0 は単語切れ目、s1 は単語切れ目でないところ、である。
図15は、カテゴリの集合を図示したものである。カテゴリには位置情報が含まれるため、単語辞書10とは異なる。カテゴリk1 は図14(a)の単語から作られ、カテゴリk2 ,k3 は図14(b)の単語から作られ、カテゴリk4 ,k5 ,k6 は図14(c)の単語から作られている。カテゴリk1 は「STLIN」、カテゴリk2は「SLIM 」、カテゴリk3 は「 SLIM」、カテゴリk4 は「SIM 」、カテゴリk5 は「 SIM 」、カテゴリk6 は「 SIM」となっている。
図13の各文字パターンに対して上述した文字認識処理により文字認識を行う。この文字認識結果が図15の各カテゴリの事後確率の計算に用いられる。計算に用いる特徴(=文字認識結果)は様々であるが、ここでは1位候補の文字を用いた例を示す。
この場合、図13の各文字パターンに対して文字認識結果が左の文字から順に「S、S、L、I、M」となっている。
文字間の特徴も様々なものが考えられるが、ここでは5.2.2節で述べた例を用いる。図13には各文字間の特徴を示している。1−2文字目の間は接触しているため、文字間の特徴はd2 である。2−3文字目の間は広いため、文字間の特徴はd0 である。3−4文字目の間、4−5文字目の間は狭いため、文字間の特徴はd1 である。
5.2.1節で述べた近似を用いると、カテゴリk1 の生起確率の、文字認識結果「S、S、L、I、M」を知ることによる変化P(k1 |rc )/P(k1 )は、上記式(30)により、
Figure 0004686433
である。カテゴリk1 の生起確率の、図13の文字間特徴を知ることによる変化P(k1 |rs )/P(k1 )は、上記式(31)により、
Figure 0004686433
である。
上記式(33)の計算をするために、3.2.2節、4.2.2節で述べた近似を用いれば、たとえば、p=0.5、n(E)=26のときは、q=0.02であるから、上記式(33)は次のように計算される。
Figure 0004686433
上記式(34)の計算をするために、あらかじめ
Figure 0004686433
を求めておく必要がある。例として、下記表1、表2の値が得られたとする。
Figure 0004686433
Figure 0004686433
上記表1は
Figure 0004686433
の値、表2はP(dk |sl)の値を表にしたものである。この場合、
Figure 0004686433
の関係にあることに注意する。実際に上記式(34)の計算に必要なのは、P(dk |sl )/P(dk )であるので、それを計算したものが下記表3である。
Figure 0004686433
上記表3の値を基にして、上記式(34)は次のように計算される。
Figure 0004686433
上記式(29)より、カテゴリk1 の生起確率の、文字認識結果「S、S、L、I、M」および図13の文字間特徴を知ることによる変化P(k1 |r)/P(k1 )は、上記式(35)、式(36)の積で表わされるので、次のようになる。
Figure 0004686433
同様に、k2 〜k6 についても、P(ki |rc )/P(ki )、P(ki |rs )/P(ki )、P(ki |r)/P(ki )を求めると、以下のようになる。
Figure 0004686433
Figure 0004686433
Figure 0004686433
上記式(37)、式(40)の中で最大なのはカテゴリk1 である。したがって、推定結果は「ST LIN」となる。
文字間の特徴を用いない4節の方法では、上記式(35)、式(38)の中で最大であるカテゴリk3 が推定結果となるが、文字間の特徴まで統合することで、総合的に最もマッチしていると考えられるカテゴリk1 が選ばれていることがわかる。
また、5.2.3節で述べたような、誤差を抑制する計算の例も示しておく。上記式(23−2)を計算する。P(k1)〜P(k6)は等しいとみなし、約分しておく。分母は上記式(40)の総和であり、3900+0.227+1350+0.337+0.0500+473≒5720である。分子は上記式(40)の各々の結果である。よって、
Figure 0004686433
となり、確率0.7以下の時はリジェクトとすることにすると、認識結果はリジェクトとなる。
このように、第2の実施の形態では、認識すべき単語に対応した入力文字列を各文字ごとに切出し、この文字切出しによって文字間の特徴を抽出するとともに、上記文字切出しによって得られる各文字に対してそれぞれ認識処理を行い、あらかじめ認識すべき単語と単語の文字間の特徴の候補が格納されている単語辞書内の各単語の各文字および文字間の特徴を条件として文字認識結果として得られた特徴が出現する確率を求め、この求めた確率を文字認識結果として得られた特徴が出現する確率で除算し、単語辞書内の各単語の各文字および文字間の特徴に対してそれぞれ求めた上記各演算結果を全ての文字および文字間について乗算し、単語辞書内の各単語に対してそれぞれ求めた上記乗算結果を全て加算し、単語辞書内の各単語に対してそれぞれ求めた上記乗算結果を上記加算結果で除算し、この結果に基づき上記単語の認識結果を得るものである。
すなわち、文字認識結果を用いた単語認識において、少なくとも単語切出しの曖昧さをも考慮した、事後確率を基にした評価関数を用いることにより、単語切出しが確実でない場合にも精度良く単語認識が行える。
また、リジェクト処理も精度良く行える。
次に、本発明の第3の実施の形態としての、文字接触、ノイズ混入のあるときのベイズ推定について説明する。この場合のベイズ推定は、文字接触、ノイズ混入が無視できないときに有用となる。
6.文字接触、ノイズ混入の統合
5節までで述べた方法では、文字が必ず正しく切出されているという前提があり、これが満たされずに文字接触があると対応できない。また、ノイズの混入にも対応できない。そこで、本節では、カテゴリを変更することにより、文字接触、ノイズの混入に対応したベイズ推定を行う。
6.1.定式化
5節の定義を基に、次のように定義を追加変更する。
変更
・カテゴリK={ki }
Figure 0004686433
追加
Figure 0004686433
・a0 :作用なし
該当2文字間に何もしない。
・a1 :接触
該当2文字を接触させる。この作用により、該当2文字は1つの非文字に変換される。
例 「ONTARIO」の「T」と「A」とを接触→ON#RIO(#は接触による非文字)
・a2 :ノイズ混入
該当2文字間にノイズ(非文字)を挿入する。
例 「ONT」の「N」と「T」との間にノイズを挿入→ON*T(*はノイズによる非文字)
ただし、l=0,Lj のときは、それぞれ文字列wcの左端、右端にノイズがあるとする。また、本定義では、ノイズが2文字以上連続して混入することはないと仮定している。
・非文字γ∈C
文字接触、ノイズ混入を考慮することによる非文字を同一視してγとし、文字集合Cに含める。
このとき、事後確率P(ki |r)は上記式(23)、式(24)と同様である。
Figure 0004686433
P(rc |ki )もほぼ上記式(25)と同様である。
Figure 0004686433
P(rs |ki )もほぼ上記式(26)と同様である。
Figure 0004686433
6.2. P(ki )について
P(wc)がわかっているものとする。ここで、P(wc)は、実際には、たとえば、郵便物Pの宛名読取りであれば、書状内での位置、行内での位置などの影響を受けるが、それらの期待値として与えられるものとする。このとき、P(wd)とP(wc)は次のような関係にあると考えられる。
Figure 0004686433
すなわち、文字接触とノイズ混入は、接触確率P(a1 )、ノイズ混入確率P(a2 )を与えることで、5節までの枠組みに統合できる。ただし、上記式(44)で
Figure 0004686433
は両端のノイズの有無に関する項であり、一般に文字間と両端ではノイズの存在する確率が異なるため、ノイズ混入確率P(a2 )とは別に値を定めるものとする。
P(wc)とP(wc,h)や、P(wd)とP(wd,h)の関係は、先ほども述べたような影響(書状内での位置など)をどうモデル化し、近似するかによるため、ここでは触れない。
6.3.非文字γについて
文字特徴として、3.2.1節のように、「1位候補の文字」を用いた場合を考える。非文字γを特徴抽出したとき、出現する1位候補の文字はどれも同様に確からしいと考えられる。そこで、次のように非文字を扱う。
Figure 0004686433
6.4.具体例
5.3節と同様に、たとえば、図16に示すような、英語の郵便物Pの宛名読取りにおいて、都市名を読むことを考える。
本節の特徴を分かりやすくするため、単語切出しが完全に成功しており、また、カテゴリに複数単語からなる文字列が存在しないという前提を設ける。図17は上述した切出し処理により切出された都市名が書かれていると考えられる部分に対応する文字パターンの切出し処理結果であり、全部で5文字であることが検出されている。単語辞書10としては、図18に示すように、都市名が全て格納されている。この場合、都市名として、「SISTAL」、「PETAR」、「STAL」の3つが格納されている。
図19は、カテゴリ集合を図示したものであり、単語辞書10を基に作られる派生文字列のうち、5文字であるものが列挙されている。全ての5文字の派生文字列を列挙すると、たとえば、「PETAR」より派生する「P#A*R」なども含まれなければならないが、6.2節に述べた接触確率P(a1 )、ノイズ混入確率P(a2 )がある程度以上小さい場合は無視することができる。本例では無視することにする。
カテゴリk1 〜k5 は、「SISTAL」の単語から作られ、カテゴリk6 は、「PETAR」の単語であり,カテゴリk7 〜k11は「STAL」の単語から作られている。カテゴリk1 は「#STAL」、カテゴリk2は「S#TAL」、カテゴリk3 は「SI#AL」、カテゴリk4 は「SIS#L」、カテゴリk5 は「SIST#」、カテゴリk6 は「PETAR」、カテゴリk7 は「*STAL」、カテゴリk8は「S*TAL」、カテゴリk9 は「ST*AL」、カテゴリk10 は「STA*L」、カテゴリk11 は「STAL*」となっている。
図17の各文字パターンに対して上述した文字認識処理により文字認識を行う。この各文字パターンごとの文字認識結果を基に、図19に示す各カテゴリごとの事後確率を計算する。
計算に用いる特徴(=文字認識結果)は様々であるが、ここでは1位候補の文字を用いた例を示す。この場合、図17の各文字パターンに対して、文字認識結果が左の文字から順に「S、E、T、A、L」となっている。これにより、図19に示すカテゴリk2 (S#TAL)の生起確率の、文字認識結果を知ることによる変化P(k2 |r)/P(k2 )は、上記式(16)より、
Figure 0004686433
である。さらに、3.2節、4.2.2節で述べた近似を用いれば、たとえば、p=0.5、n(E)=26のときは、q=0.02であるから、上記式(46)は次のように計算される。
Figure 0004686433
計算過程を見ると、結局、非文字以外の4文字について計算していることと等価になっている。同様にして、他のカテゴリについても計算される。ここでは代表として、大きな値を示すと容易に推察されるk6 ,k7 ,k8 について計算する。
Figure 0004686433
これらの比較に際し、5節まではP(ki )を等しいと見なしていたが、本節では6.2節で述べたように、文字接触、ノイズ混入を考慮することによって、P(ki )に変化が生じている。そこで、変化が生じる前のP(ki )を、全て等しいと見なしてP(ki )=P0 とおくことにする。P0 は、上記式(44)におけるP(wc)であると考えることができる。また、変化が生じた後のP(ki )は、上記式(44)におけるP(wd)と考えられる。したがって、変化が生じた後のP(ki )は次のようになる。
Figure 0004686433
ここで、接触確率P(a1 )=0.05、文字間ノイズ混入確率P(a2 )=0.002、両端ノイズ混入確率P′(a2 )=0.06とすると、たとえば、P(k2 )は次のように計算される。
Figure 0004686433
計算中、文字間において文字接触もノイズ混入もない確率P(a0 )=1−P(a1 )−P(a2 )=0.948、両端においてノイズ混入のない確率P′(a0 )=1−P′(a2 )=0.94を用いている。
同様にして、P(k6 ),P(k7 ),P(k8 )を計算すると、
Figure 0004686433
上記式(50)、式(51)を上記式(47)、式(48)に用いて変形すると、以下のようになる。
Figure 0004686433
参考までに他のカテゴリについて同様な計算をすると、以下のようになる。
Figure 0004686433
以上より、事後確率が最も大きいのはカテゴリk2 であり、図16に書かれている都市名は「SISTAL」で、「I」と「S」とが接触していると推定される。
また、誤差を抑制する計算の例も示しておく。分母は、上記P(k1 |r)〜P(k11|r)の総和であり、40.7P0 +1020P0 +40.7P0 +1.63P0 +0.0653P0 +424P0 +54.8P0 +45.5P0 +1.81P0 +0.0727P0 +0.0880P0 ≒1630P0 である。分子は上記P(k1 |r)〜P(k11|r)である。よって、最大であるk2 についてのみ計算すると、
Figure 0004686433
となり、確率0.7以下の時はリジェクトとすることにすると、認識結果はリジェクトとなる。
このように、第3の実施の形態は、単語辞書内の各単語の各文字には、文字に加えて非文字の情報を含ませ、かつ、非文字の情報を含む文字の単語の出現確率は、非文字の情報を含まない文字の単語の出現確率を基に設定することにより、文字認識結果を用いた単語認識において、文字接触やノイズ混入をも考慮した、事後確率を基にした評価関数を用いて単語認識を行うことができ、これにより、文字接触やノイズ混入がある場合にも精度良く単語認識が行える。
また、リジェクト処理も精度良く行える。
次に、本発明の第4の実施の形態としての、文字の切出しが一意に定まらないときのベイズ推定について説明する。この場合のベイズ推定は、漢字や仮名など、分離のある文字では有用である。また、英語における筆記体など、実際の文字どうしの切れ目以外にも多くの切れ目の候補を出さざるを得ない場合にも有用である。
7.文字切出しの統合
6節までで述べてきた方法では、文字自体が分離することはないという前提があった。しかし、漢字や仮名など、文字自体が2つ以上に分離する場合もある。たとえば、『明』という漢字は、文字切出しを行うと、へんとつくりが別々に文字候補として切出される。このとき、2つの文字候補を結合するべきか、別々にするべきか、により、複数の文字切出し候補が現われる。
このような文字の分離には、6節までの方法では対応できない。また、逆に文字接触が多く、それを切る処理をしている場合、実際に接触しているところだけでなく、文字自体を切ってしまうこともある。後で詳しく述べるが、認識の戦略として文字自体の切断をある程度許容する方が、性能がよい。この場合も同様に、6節までの方法では対応できない。そこで、本節では、文字の分離による複数の文字切出し候補に対応したベイズ推定を行う。
7.1.文字切出しについて
文字が接触することのある対象における文字切出しにおいては、文字接触を切る処理が行われる。この処理において、「文字の切れ目でない箇所」が切れ目候補に挙がる場合と、「文字の切れ目」が切れ目候補に挙がらない場合を比べると、後者の方が認識に悪影響を与える。理由は次の通りである。
・「文字の切れ目でない箇所」が切れ目候補に挙がる場合
「切れ目候補で切った場合」と「切らない場合」を試すことができるので、切り過ぎたことで正しい文字切出しがなくなるわけではない。
・「文字の切れ目」が切れ目候補に挙がらない場合
正しい文字切出しを得る手段はない。
このため、文字切出しにおいて、文字の切れ目以外にも多くの切れ目候補を挙げておくことは有用である。しかし、「切れ目候補で切った場合」と「切らない場合」を試すということは、複数の文字切出しパターン候補があることになる。6節までで述べてきた方法では、異なる文字切出しパターン候補間の比較はできない。そこで、以下に説明する方法でこれを解決する。
7.2.定式化
6節の定義を基に、次のように定義を追加変更する。
変更
・切れ目状態の集合S={s0 ,s1 ,s2 (,s3 )}
s0 :単語切れ目である、s1 :文字切れ目である、s2 :文字切れ目ではない、(s3 :行先頭または最後尾)
5節以降で定義していた『切れ目である』は「単語切れ目である」の意味であり、s0 にあたる。『切れ目でない』はs1 とs2 に分かれたことになる。
・L:切れ目候補で分割された部分(これを「セル」と呼ぶことにする)の個数
追加
Figure 0004686433
変更
・カテゴリK={ki }
Figure 0004686433
追加
Figure 0004686433
変更
Figure 0004686433
このとき、事後確率P(ki |r)は、やはり上記式(23)、式(24)と同様である。
Figure 0004686433
P(rc |ki )は次のように表わされる。
Figure 0004686433
P(rs |ki )は次のように表わされる。
Figure 0004686433
P(ki )は、本節ではカテゴリki にmjkが含まれているため、その影響を考慮する必要がある。個々の文字の当てはまるユニットの形状、ユニットに当てはまっている文字、近傍ユニット間の形状バランスなどが影響すると考えられるが、そのモデル化についてはここでは触れない。
7.3.実用に向けた近似
7.3.1.文字列のない部分に対する近似と文字数正規化
4.2.1節と同様の近似を上記式(54)に用いると、次のようになる。
Figure 0004686433
実際には、rcn1n3とrcn1n2,rcn2cn3との間には何らかの相関があると考えられるため、この近似は4.2.1節のときよりもさらに粗いものである。
また、上記式(55)も同様に近似すると次のようになる。
Figure 0004686433
さらに、5.2.1節と同様に、P(ki |r)/P(ki )を計算すると次のようになる。
Figure 0004686433
上記式(32)と同様、上記式(58)も派生文字列wdの当てはまっていない部分に関する記述はなく、「分母による正規化」の考え方ができる。
7.3.2.切れ目と文字間特徴rs について
6節までと違い、本節では切れ目状態としてs2 (文字切れ目でない)があるので、文字間特徴集合として5.2.2節と同様にDを用いた場合、
Figure 0004686433
を求めておけばよいことになる。ここで注意しなければならないのは、これらは全て7.1節で述べたように、「切れ目候補」として挙がった部分における話であることである。s2 (文字切れ目でない)は、「切れ目候補として挙がったが切れ目ではない」という意味であり、
Figure 0004686433
を求める際に気をつける必要がある。
Figure 0004686433
を求める際も同様である。
7.3.3.誤差の抑制
上記式(58)は粗い近似の元に導かれた式であり、精度に問題の起こることがある。そこで、より精度を高めるため、上記式(53)からの式変形を以下のように行う。
Figure 0004686433
但し、
Figure 0004686433
とする。
これにより、上記式(58)の2行目の分母で用いていた近似を回避することができ、誤差が抑制される。
matchC(ki )は上記式(58)と同じ式である。つまり、各ki について上記式(58)を計算し、それを代入することで、上記式(53−2)は計算される。
7.4.具体例
6.4節と同様に、英語の郵便物の宛名読取りにおいて、都市名を読むことを考える。
本節の特徴を分かりやすくするため、単語切出しが完全に成功しており、カテゴリに複数の単語からなる文字列が存在せず、ノイズの混入もなく、文字切出しによって全ての文字切れ目が検出されている(すなわち、6節のようにノイズ、接触文字に関するカテゴリが必要ない)とする。
図20は、都市名が書かれていると考えられる部分であり、5つのセルがある。図21(a)〜図21(d)は、考えられる文字切出しパターン候補である。本例では、簡単のため、セル2と3、セル4と5の間は必ず切れることがあらかじめ分かっているとした(切れない確率がごく小さいため、無視したと考えてもよい)。
すると、切れ目候補はセル1と2、セル3と4の間であり、考えられる文字切出しパターン候補を列挙すると、図21(a)〜図21(d)のようになる。図22は単語辞書10の内容であり、全ての都市名が格納されている。本例では、都市名は3候補ある。
この場合、都市名として、「BAYGE」、「RAGE」、「ROE」の3つが格納されている。
図23(a)〜図23(d)は、カテゴリ集合を図示したものである。単語切出しが完全に成功しているという前提なので、「BAYGE」は図21(a)、「RAGE」は図21(b)、図21(c)、「ROE」は図21dにのみ当てはまる。
図23(a)に示すカテゴリk1において、セル1−2間、セル3−4の間は共に、「文字の切れ目」(S1)となっている。
図23(b)に示すカテゴリk2において、セル1−2間は、「文字の切れ目」(S1)となり、セル3−4の間は「文字の切れ目でない」(S2)となっている。
図23(c)に示すカテゴリk3において、セル1−2間は、「文字の切れ目でない」(S2)となり、セル3−4の間は「文字の切れ目」(S1)となっている。
図23(d)に示すカテゴリk4において、セル1−2間、セル3−4の間は共に、「文字の切れ目でない」(S2)となっている。
図21(a)〜図21(d)に現れる各ユニットを文字認識にかけ、その文字認識結果が図23(a)〜図23(d)のカテゴリの事後確率の計算に用いられる。計算に用いる特徴(=文字認識結果)は様々であるが、ここでは1位候補の文字を用いた例を示す。
図24は、各ユニットの認識結果を示している。たとえば、セル1と2とを結合したユニットは、認識結果の1位が「R」であったことを示す。
文字間特徴も様々なものが考えられるが、ここでは5.2.2節で述べた例を簡略化して、次のようなものを用いる。
・文字間特徴集合D′={d′1 ,d′2 }
d′1 :接触していない
d′2 :接触している
図25は、セル1−2間、3−4間の文字間特徴を示している。1−2間は接触しておらず、3−4間は接触している。
7.3.1節で述べた近似を用いると、カテゴリk1 (BAYGE)の生起確率の、図24の認識結果を知ることによる変化P(k1 |rc )/P(k1 )は、上記式(58)より、
Figure 0004686433
である。カテゴリk1 の生起確率の、図25の文字間特徴を知ることによる変化P(k1 |rs )/P(k1 )は、上記式(58)より、
Figure 0004686433
である。
上記式(59)の計算をするために、3.2.2節、4.2.2節で述べた近似を用いれば、たとえば、p=0.5、n(E)=26のときは、q=0.02であるから、上記式(59)は次のように計算される。
Figure 0004686433
上記式(60)の計算をするために、あらかじめ
Figure 0004686433
を求めておく必要がある。例として下記表4、表5の値が得られたとする。
Figure 0004686433
Figure 0004686433
上記表4は
Figure 0004686433
の値、表5はP(d'k |sl )の値を表にしたものである。この場合、
Figure 0004686433
の関係にあることに注意する。実際に上記式(60)の計算に必要なのは、P(d'k |sl )/P(d'k )であるので、それを計算したものが下記表6である。
Figure 0004686433
上記表6の値を基にして、上記式(60)は次のように計算される。
Figure 0004686433
上記式(60)より、カテゴリk1 の生起確率の、図24の文字認識結果および図25の文字間特徴を知ることによる変化P(k1 |r)/P(k1 )は、上記式(61)、式(62)の積で表わされるので、次のようになる。
Figure 0004686433
同様に、k2 〜k4 についても、P(ki |rc )/P(ki )、P(ki |rs )/P(ki )、P(ki |r)/P(ki )を求めると、以下のようになる。
Figure 0004686433
Figure 0004686433
Figure 0004686433
これらの比較に際し、5節まではP(ki )を等しいと見なしていたが、本節では文字の形状を考慮にいれる。
図21(d)は各ユニットの幅が揃っている。図21(a)はそれに次いで揃っている。しかし、図21(b)、図21(c)は不揃いである。
この揃っているかどうかの度合いを何らかの方法でモデル化してP(ki )に反映させれば、より正確な単語認識が可能になるが、ここではその方法は問わない。
本例では、その結果として、
Figure 0004686433
になったとする。比例定数をP1 とし、上記式(63)、式(66)に上記式(67)を用いて変形すると、以下のようになる。
Figure 0004686433
以上より、事後確率が最も大きいのはカテゴリk1 であり、図16に書かれている都市名は「BAYGE」であると推定される。
図24の文字認識による結果が最も大きいのは、上記式(61)、式(64)よりカテゴリk3 であり、図25の文字間特徴による結果が最も大きいのは、上記式(62)、式(65)よりカテゴリk2 であり、文字形状のバランスの評価が最も高いのはカテゴリk4 であるが、全てを統合した推定を行うことで、カテゴリk1 を選ぶことができている。
また、7.3.3節で述べたような、誤差を抑制する計算の例も示しておく。上記式(53−2)を計算する。分母は上記式(68)の総和であり、11086P1 +162P1 +249P1 +1710P1 ≒13200P1 である。分子は上記式(68)の各々の結果である。よって、
Figure 0004686433
となり、確率0.9以下の時はリジェクトとすることにすると、認識結果はリジェクトとなる。
このように、第4の実施の形態では、認識すべき単語に対応した入力文字列を各文字ごとに切出すとともに、この文字切出しによって文字間の接離を考慮した複数種類の切出し結果を求め、この求めた全ての切出し結果の各文字に対してそれぞれ認識処理を行い、あらかじめ認識すべき単語と単語の文字間の特徴の候補が格納されている単語辞書内の各単語の各文字および文字間の特徴を条件として文字認識結果として得られた特徴が出現する確率を求め、この求めた確率を文字認識結果として得られた特徴が出現する確率で除算し、単語辞書内の各単語の各文字および文字間の特徴に対してそれぞれ求めた上記各演算結果を全ての文字および文字間について乗算し、単語辞書内の各単語に対してそれぞれ求めた上記乗算結果を全て加算し、単語辞書内の各単語に対してそれぞれ求めた上記乗算結果を上記加算結果で除算し、この結果に基づき上記単語の認識結果を得るものである。
すなわち、文字認識結果を用いた単語認識において、少なくとも文字切出しの曖昧さをも考慮した、事後確率を基にした評価関数を用いることにより、文字切出しが確実でない場合にも精度良く単語認識が行える。
また、リジェクト処理も精度良く行える。
本発明によれば、文字認識結果を用いた単語認識において、単語の文字数が一定とは限らない場合にも用いることのできる事後確率を基にした評価関数を用いることにより、単語の文字数が一定でない場合においても精度良く単語認識が行える。
また、リジェクト処理も精度良く行える。
また、本発明によれば、文字認識結果を用いた単語認識において、少なくとも単語切出しの曖昧さをも考慮した事後確率を基にした評価関数を用いることにより、単語切出しが確実でない場合にも精度良く単語認識が行える。
また、リジェクト処理も精度良く行える。
また、本発明によれば、文字認識結果を用いた単語認識において、少なくとも文字接触をも考慮した事後確率を基にした評価関数を用いることにより、文字接触がある場合にも精度良く単語認識が行える。
また、リジェクト処理も精度良く行える。
また、本発明によれば、文字認識結果を用いた単語認識において、少なくともノイズ混入をも考慮した事後確率を基にした評価関数を用いることにより、ノイズ混入がある場合にも精度良く単語認識が行える。
また、リジェクト処理も精度良く行える。
さらに、本発明によれば、文字認識結果を用いた単語認識において、少なくとも文字切出しの曖昧さをも考慮した事後確率を基にした評価関数を用いることにより、文字切出しが確実でない場合にも精度良く単語認識が行える。
また、リジェクト処理も精度良く行える。
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
図1は、本発明の実施の形態に係る単語認識方法を実現するための単語認識システムの構成を概略的に示すブロック図。 図2は、宛名が記載されている郵便物の記載例を示す図。 図3は、単語認識方法の概略を説明するフローチャート。 図4は、都市名として切出された文字パターンを示す図。 図5は、単語辞書の内容を示す図。 図6は、確率テーブルの内容を示す図。 図7は、確率テーブルの内容を示す図。 図8は、宛名が記載されている郵便物の記載例を示す図。 図9は、都市名として切出された文字パターンを示す図。 図10は、単語辞書の内容を示す図。 図11は、確率テーブルの内容を示す図。 図11は、宛名が記載されている郵便物の記載例を示す図。 図13は、都市名として切出された文字パターンを示す図。 図14は、単語辞書の内容を示す図。 図15は、図14の単語辞書に対するカテゴリの集合を示す図。 図16は、宛名が記載されている郵便物の記載例を示す図。 図17は、都市名として切出された文字パターンを示す図。 図18は、単語辞書の内容を示す図。 図19は、図18の単語辞書に対するカテゴリの集合を示す図。 図20は、都市名として切り出されセルを示す図。 図21は、文字切出しパターン候補を示す図。 図22は、単語辞書の内容を示す図。 図23は、図22の単語辞書に対するカテゴリの集合を示す図。 図24は、文字切出しパターン候補に対する各ユニットの認識結果を示す図。 図25は、文字間特徴を示す図。
符号の説明
1…CPU、2…入力装置、3…スキャナ、4…表示装置、5…第1のメモリ、6…第2のメモリ、7…読取装置、8…ROM、9…文字辞書、10…単語辞書、11…確率テーブル。

Claims (3)

  1. 認識すべき単語に対応した入力文字列を各文字ごとに認識処理を行うことにより文字認識結果を得る文字認識処理ステップと、
    あらかじめ認識すべき単語の候補が格納されている単語辞書内の各単語の各文字を条件として上記文字認識処理ステップにより文字認識結果として得られた特徴が出現する確率を求める確率算出ステップと、
    この確率算出ステップにより求めた確率と上記文字認識処理ステップにより文字認識結果として得られた特徴が出現する確率との間で除算を行う第1の演算ステップと、
    上記除算により上記単語辞書内の各単語の各文字に対してそれぞれ求めた各演算結果の間で乗算を行う第2の演算ステップと、
    上記乗算により上記単語辞書内の各単語に対してそれぞれ求めた各演算結果を全て足し合わせる第3の演算ステップと、
    上記乗算により上記単語辞書内の各単語に対してそれぞれ求めた各演算結果を第3の演算ステップの演算結果で割る第4の演算ステップと、
    この第4の演算ステップによる演算結果の最大値が所定のしきい値以下の場合は認識結果をリジェクトとし、前記所定のしきい値を超える場合は最大値となる単語を認識結果とする単語認識処理ステップと、
    を具備したことを特徴とする単語認識方法。
  2. 認識すべき単語に対応した入力文字列を各文字ごとに切出す切出しステップと、
    この切出しステップによる文字切出しによって、文字間が接しているかあるいは文字間が離れているかを考慮した複数種類の切出し結果を求めるステップと、
    このステップにより求めた全ての切出し結果の各文字に対してそれぞれ認識処理を行う文字認識処理ステップと、
    あらかじめ認識すべき単語の候補が格納されている単語辞書内の各単語の各文字を条件として上記文字認識処理ステップにより文字認識結果として得られた特徴が出現する確率を求める確率算出ステップと、
    この確率算出ステップにより求めた確率と上記文字認識処理ステップにより文字認識結果として得られた特徴が出現する確率との間で除算を行う第1の演算ステップと、
    上記除算により上記単語辞書内の各単語の各文字に対してそれぞれ求めた各演算結果の間で乗算を行う第2の演算ステップと、
    上記乗算により上記単語辞書内の各単語に対してそれぞれ求めた各演算結果を全て足し合わせる第3の演算ステップと、
    上記乗算により上記単語辞書内の各単語に対してそれぞれ求めた各演算結果を第3の演算ステップの演算結果で割る第4の演算ステップと、
    この第4の演算ステップによる演算結果の最大値が所定のしきい値以下の場合は認識結果をリジェクトとし、前記所定のしきい値を超える場合は最大値となる単語を認識結果とする単語認識処理ステップと、
    を具備したことを特徴とする単語認識方法。
  3. 認識すべき単語に対応した入力文字列を各文字ごとに認識処理を行うことにより文字認識結果を得る文字認識処理手段と、
    あらかじめ認識すべき単語の候補が格納されている単語辞書内の各単語の各文字を条件として上記文字認識処理手段により文字認識結果として得られた特徴が出現する確率を求める確率算出手段と、
    この確率算出手段により求めた確率と上記文字認識処理手段により文字認識結果として得られた特徴が出現する確率との間で除算を行う第1の演算手段と、
    上記除算により上記単語辞書内の各単語の各文字に対してそれぞれ求めた各演算結果の間で乗算を行う第2の演算手段と、
    上記乗算により上記単語辞書内の各単語に対してそれぞれ求めた各演算結果を全て足し合わせる第3の演算手段と、
    上記乗算により上記単語辞書内の各単語に対してそれぞれ求めた各演算結果を第3の演算手段の演算結果で割る第4の演算手段と、
    この第4の演算手段による演算結果の最大値が所定のしきい値以下の場合は認識結果をリジェクトとし、前記所定のしきい値を超える場合は最大値となる単語を認識結果とする単語認識処理手段と、
    を具備したことを特徴とする単語認識装置。
JP2006280413A 2006-10-13 2006-10-13 単語認識方法および単語認識装置 Active JP4686433B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2006280413A JP4686433B2 (ja) 2006-10-13 2006-10-13 単語認識方法および単語認識装置
EP07792960A EP2088537A4 (en) 2006-10-13 2007-08-24 METHOD AND SOFTWARE RECOGNITION SOFTWARE
PCT/JP2007/066431 WO2008044393A1 (fr) 2006-10-13 2007-08-24 Procédé et logiciel de reconnaissance de mots
KR1020097007460A KR101065152B1 (ko) 2006-10-13 2007-08-24 단어 인식 방법 및 단어 인식 프로그램을 기록한 기록 매체
US12/419,512 US20090190841A1 (en) 2006-10-13 2009-04-07 Word recognition method and storage medium that stores word recognition program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006280413A JP4686433B2 (ja) 2006-10-13 2006-10-13 単語認識方法および単語認識装置

Publications (2)

Publication Number Publication Date
JP2008097452A JP2008097452A (ja) 2008-04-24
JP4686433B2 true JP4686433B2 (ja) 2011-05-25

Family

ID=39282602

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006280413A Active JP4686433B2 (ja) 2006-10-13 2006-10-13 単語認識方法および単語認識装置

Country Status (5)

Country Link
US (1) US20090190841A1 (ja)
EP (1) EP2088537A4 (ja)
JP (1) JP4686433B2 (ja)
KR (1) KR101065152B1 (ja)
WO (1) WO2008044393A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4672692B2 (ja) 2007-03-14 2011-04-20 株式会社東芝 単語認識システムおよび単語認識プログラム
US20090208112A1 (en) * 2008-02-20 2009-08-20 Kabushiki Kaisha Toshiba Pattern recognition method, and storage medium which stores pattern recognition program
NZ589039A (en) * 2009-09-24 2013-04-26 Nec Corp Recognition of a word image with a plurality of characters by way of comparing two possible candidates based on an evaluation value
JP5767913B2 (ja) * 2011-09-05 2015-08-26 株式会社東芝 単語認識装置、単語認識方法、及び単語認識装置を備える紙葉類処理装置
JP6062273B2 (ja) * 2013-02-05 2017-01-18 株式会社東芝 パターン認識装置、パターン認識方法、及びパターン認識プログラム
CN106599900B (zh) * 2015-10-20 2020-04-21 华中科技大学 一种识别图像中的字符串的方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001283157A (ja) * 2000-01-28 2001-10-12 Toshiba Corp 単語認識方法および単語認識プログラム
JP2003123025A (ja) * 2001-10-17 2003-04-25 Toshiba Corp パターン認識装置とパターン認識方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05174195A (ja) * 1991-01-25 1993-07-13 Matsushita Electric Ind Co Ltd 英文字認識装置
US5727081A (en) * 1991-12-31 1998-03-10 Lucent Technologies Inc. System and method for automated interpretation of input expressions using novel a posteriori probability measures and optimally trained information processing networks
US6847734B2 (en) * 2000-01-28 2005-01-25 Kabushiki Kaisha Toshiba Word recognition method and storage medium that stores word recognition program

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001283157A (ja) * 2000-01-28 2001-10-12 Toshiba Corp 単語認識方法および単語認識プログラム
JP2003123025A (ja) * 2001-10-17 2003-04-25 Toshiba Corp パターン認識装置とパターン認識方法

Also Published As

Publication number Publication date
US20090190841A1 (en) 2009-07-30
KR20090053953A (ko) 2009-05-28
EP2088537A4 (en) 2011-11-23
JP2008097452A (ja) 2008-04-24
KR101065152B1 (ko) 2011-09-16
WO2008044393A1 (fr) 2008-04-17
EP2088537A1 (en) 2009-08-12

Similar Documents

Publication Publication Date Title
KR100401686B1 (ko) 단어인식방법과 단어인식 프로그램을 기억한 기억매체
US7596272B2 (en) Handling of diacritic points
US7756335B2 (en) Handwriting recognition using a graph of segmentation candidates and dictionary search
Tripathy et al. Handwriting segmentation of unconstrained Oriya text
JP4686433B2 (ja) 単語認識方法および単語認識装置
EP2138959B1 (en) Word recognizing method and word recognizing program
JP4601835B2 (ja) 単語認識方法および単語認識プログラムおよび単語認識装置
JP4958236B2 (ja) 手書きパターンを認識するための方法及び装置
JP2008225695A (ja) 文字認識誤り修正装置およびプログラム
JP4194020B2 (ja) 文字認識方法、該方法の実行に用いるプログラム及び文字認識装置
JP6310155B2 (ja) 文字認識装置、文字認識方法及び文字認識プログラム
JP5039659B2 (ja) 文字認識方法及び文字認識装置
JP2022095391A (ja) 情報処理装置、及び情報処理プログラム
KR20180030966A (ko) 중첩된 필기 인식 기술을 위한 시스템 및 방법
JP2000322514A (ja) パターン抽出装置及び文字切り出し装置
JP6166532B2 (ja) 文字認識方法及び文字認識装置
JP4141217B2 (ja) 文字認識方法、該方法の実行に用いるプログラム及び文字認識装置
JP3374762B2 (ja) 文字認識方法及びその装置
JPH11203406A (ja) 文字切り出し方法、文字認識方法、文字認識装置および記録媒体
JP2001266070A (ja) 文字認識装置、文字認識方法および記憶媒体
JP2019101512A (ja) 文字認識プログラム
JPH08212301A (ja) 文字切出装置及びその切出方法
JP2000090200A (ja) 文字認識方法、装置および記録媒体
JPH07239915A (ja) オンライン手書き文字列切り出し認識装置
JP2007257249A (ja) 文字認識方法及びその装置及びそのプログラムを格納した記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090902

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100720

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100921

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101019

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101215

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110118

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110214

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140218

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4686433

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140218

Year of fee payment: 3