JP4237864B2 - 単語認識装置 - Google Patents

単語認識装置 Download PDF

Info

Publication number
JP4237864B2
JP4237864B2 JP11373399A JP11373399A JP4237864B2 JP 4237864 B2 JP4237864 B2 JP 4237864B2 JP 11373399 A JP11373399 A JP 11373399A JP 11373399 A JP11373399 A JP 11373399A JP 4237864 B2 JP4237864 B2 JP 4237864B2
Authority
JP
Japan
Prior art keywords
word
unit
feature
character
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP11373399A
Other languages
English (en)
Other versions
JP2000306045A (ja
Inventor
悦伸 堀田
浩明 武部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP11373399A priority Critical patent/JP4237864B2/ja
Publication of JP2000306045A publication Critical patent/JP2000306045A/ja
Application granted granted Critical
Publication of JP4237864B2 publication Critical patent/JP4237864B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、手書き文字列を認識する単語認識装置に関する。
【0002】
【従来の技術】
近年、手書き文字入力機器として文字認識装置OCR(Optical Charactor Reader)の需要が増加している。
文字認識装置の中には個別文字認識装置のほか、文字認識を向上させるため、文字列に注目した単語認識装置が登場している。
【0003】
図7(a)に従来例の個別文字認識装置31の構成図を示す。
個別文字認識装置31は、画像入力部2、正規化部3、特徴抽出部4、特徴照合部5、認識結果出力部6、個別文字辞書7より構成される。
【0004】
画像入力部2は、スキャナなどにより手書き文字の入力画像を取得する。正規化部3は、文字の大きさ、位置を一定に揃える。特徴抽出部4は、正規化された入力画像から特徴量を抽出する。特徴照合部5は、個別文字辞書7の文字の特徴量と、特徴抽出部4が抽出した特徴量とを照合する。認識結果出力部6は、特徴照合部5で照合した結果をディスプレイなどに出力する。個別文字辞書7は文字とその特徴量とから構成される。
【0005】
図7(b)の住所例を参照して、動作を説明する。
【0006】
画像入力部2から入力された文字列「東京都」は、正規化部3で規定の大きさに揃えられた後、特徴抽出部4で、文字の特徴量を抽出される。抽出結果の「東」の特徴量、「京」の特徴量、「都」の特徴量を特徴照合部5へ渡す。
【0007】
特徴照合部5では、個別文字辞書7のすべての文字と特徴抽出部4からの「 東」「京」「 都」の特徴量とを各々比較し、その結果、特徴量の差分が最小値となった文字を認識結果として認識結果出力部6より出力する。
【0008】
図8(a)に従来例の単語認識装置1の構成図を示す。
【0009】
単語認識装置1は、画像入力部2、正規化部3、特徴抽出部4、特徴照合部5特徴合成部8、認識結果出力部6、単語リスト部9および個別文字辞書7を備える。
【0010】
画像入力部2は、スキャナなどにより手書き文字の入力画像を取得する。正規化部3は、文字の大きさ、位置を一定に揃える。特徴抽出部4は、入力画像から特徴量を抽出する。特徴合成部8は、単語を選択し、選択された単語を構成する個々の文字の特徴量を個別文字辞書7から抽出し合成する。特徴照合部5は、特徴合成部8が合成した単語の特徴量と特徴抽出部4が抽出した入力画像の特徴量とを照合する。単語リスト部9は、複数の単語リストからなる。認識結果出力部6は、特徴照合部5で照合した結果の中で最も類似した特徴量を持つ単語をディスプレイなどに出力する。個別文字辞書7は、文字とその特徴量とから構成される。
【0011】
図8(b)は、住所例を示す。
【0012】
都道府県などのキーとなる文字は、規定の座標に印刷されているものとする。
【0013】
画像入力部2は入力された画像について、まず都道府県のキーとなる文字が印刷されている位置を検出し、その前の文字列「東京」を切り出す。切り出された文字列を正規化部3で正規化する。正規化された単語は、特徴抽出部4で特徴量を抽出し、特徴照合部5に渡す。特徴合成部8は、単語リスト部9の中にある都道府県の単語リストを選択する。単語リストには、「北海」、「東京」、「沖縄」等が単語として登録されており、個別文字辞書7には、すべての文字の特徴量が登録されている。
【0014】
まず、特徴合成部8は、都道府県の単語リストに従って、まず「北海」の単語を選択し、個別文字辞書7から、「北」と「海」の特徴量が取り出され、「北海」の特徴量を合成する。その合成結果と入力画像の特徴量とが特徴照合部5で照合され、両者間の特徴量の差を求める。そして同様の処理を単語リストのすべての単語について行う。照合処理が終了するとそれらの単語の中で特徴量の差分の小さいものを認識結果出力部6から認識結果として出力する。
【0015】
【発明が解決しようとする課題】
文字を個別に認識している装置では、文字が接触している文字列を精度よく切り出すことは、困難であった。そのため、接触文字を分離せずに単語として一括して捉える単語認識方式が登場している。しかし、単語を個々の文字に分離することなく一括して認識する方式では、単語の画像から単語特徴量を抽出しているため、文字同士が同じ高さに並んでいれば、高い認識で行えるが文字列が傾いている場合や単語を構成する文字のサイズがばらばらで異なる場合は、認識精度が低かった。
【0016】
また、単語認識装置の特徴合成部で単語の特徴量を合成するときには、個別文字辞書を基本にして合成しているため、「太秦馬塚」、「太秦垣内」のように同じ部分文字列が含まれている「太秦」の部分について毎回、合成処理を行うため合成処理に無駄があった。
【0017】
また、単語認識装置の特徴合成部で単語の特徴量を合成するとき、単一サイズの個別文字辞書からの抽出のため、入力画像の特徴量との間で特徴次元数に差を生じ、誤読の要因となっていた。さらに傾いた単語も誤読の要因になっていた。
【0018】
また、単語認識装置の特徴照合部では、同一文字が含まれている単語間で、同一文字の特徴量が原因で、誤読が生じやすかった。
本発明の目的は、
(1)傾いた単語および異なる文字サイズの単語の認識精度を高めた単語認識装置の提供と、
(2)合成速度が速く認識精度を高めた特徴合成方式を有する単語認識装置の提供と、
(3)同一文字が含まれている単語間の誤読を防止した特徴照合方式を有する単語認識装置の提供にある。
【0019】
【課題を解決するための手段】
入力画像の単語を構成する個々の文字を認識する個別文字認識部と、入力画像の単語を一括して認識する単語認識部と、個別文字認識部の認識結果からの単語の確信度の算出と単語認識部の認識結果からの単語の確信度の算出とを行う確信度算出部と、確信度算出部で算出された個別文字認識部と単語認識部の確信度算出結果を比較する確信度比較部とを備え、確信度比較部は、確信度の比較結果に基づき、個別文字認識部と単語認識部の確信度の大きい方を選択する構成の単語認識装置。
【0020】
この構成により、個別文字認識部と単語認識部を併用することで、それぞれ単独で用いた場合以上の認識精度を出すことが可能である。すなわち単語認識部は接触文字の認識精度が高く、個別認識部は、傾き文字および文字サイズの変化の認識精度が高いというように、お互いを補完し合う。
【0021】
また、入力画像の個々の文字を認識する個別文字認識部と、入力画像の単語を一括して認識する単語認識部と、入力画像の単語を構成する個々の文字の間隔を検出する文字間隔検出手段と、文字間隔検出手段により検出された間隔を所定の閾値と比較する文字間隔比較手段とを備え、文字間隔比較手段は、検出された文字間隔が所定の閾値より小さければ単語認識部を選択し、検出された文字間隔が所定の閾値より大きければ個別文字認識部を選択する構成の単語認識装置。
【0022】
この構成により、個別文字認識部と単語認識部を使いわけることで、それぞれ単独で用いた場合以上の認識精度を出すことが可能であり、また高速で処理が可能となる。すなわち文字間隔が狭い場合は、単語認識部を使用することで、接触文字の認識精度を高くし文字間隔が広い場合は、個別認識部を使用して、傾き文字および異なる文字サイズの認識精度を高くするというように、お互いを補完し合う。
【0023】
また、入力画像から単語の特徴量を抽出した結果と辞書の個々の文字の特徴量から単語の特徴量を合成した結果とを照合することで単語の認識を行う単語認識装置であって、複数の各種サイズの文字、部分文字列の特徴量と複数の各種文字サイズの画像を保持する辞書と、前記辞書に基づいて文字、部分文字列の特徴量から単語の特徴量を合成する手段および前記辞書に基づいて文字の画像から単語の画像を合成し特徴量の抽出を行う手段を有する特徴合成部とを備えた構成である。
【0024】
この構成により、単語を構成する文字だけでなく、出現頻度の高い部分文字列の特徴量を予め辞書として持つことで、単語の特徴量の合成の高速化が図れるとともに、異なる文字サイズ、部分文字列を持つことで認識精度が高まる。さらに画像合成をすることにより、傾斜した単語の特徴量も抽出できるので、傾斜した単語の認識精度も高まる。
【0025】
また、所定の単語サイズの特徴量を合成する文字、部分文字列の特徴量を文字数に応じたサイズで辞書より選択する選択手段を有する特徴合成部を備えた構成の単語認識装置。
【0026】
この構成により、文字数に応じた複数の異なる文字サイズを持ち、同一正規化サイズで、単語の特徴量を合成することで、入力画像の特徴次元数と合成した特徴次元数とが同一となり、認識精度が向上する。
【0027】
また、辞書から抽出した単語を構成する文字、部分文字列の特徴量から所定のサイズの文字、部分文字列の特徴量に変換する変換手段を有する特徴合成部を備えた構成の単語認識装置。
【0028】
この構成により、個別文字認識用の標準の文字サイズ、部分文字列サイズの特徴量を基に、異なるサイズの単語の特徴量を合成できるので、小さい辞書容量で認識精度を向上できる。
【0029】
また、辞書から抽出した単語を構成する文字、部分文字列の線量による複雑度に応じて文字、部分文字列の特徴量に重み付けをする複雑度重み付け手段と、複雑度重み付け手段により算出された重み付けに基づいて、辞書から抽出した単語を構成する文字、部分文字列を所定のサイズの文字、部分文字列に変換する変換手段とを有する特徴合成部を備えた構成の単語認識装置。
【0030】
この構成により、複雑な形状の文字の特徴次元数を高くし、簡単な形状の文字の特徴次元数を低くすることで、文字の形状に応じた認識となり、小さい辞書容量で高精度の認識が可能となる。
【0031】
また、入力画像の単語の傾きを検出する傾斜度検出手段と、単語を構成する画像を辞書より抽出して傾斜度検出手段により検出した傾きに沿って単語画像を配置し画像の合成と特徴量の抽出を行う手段を有する特徴合成部とを備えた構成の単語認識装置。
【0032】
この構成により、入力された単語の傾きに対応した単語の特徴量を生成することができ、傾いた文字列中の単語の認識精度が高くなる。
【0033】
また、入力画像の単語を構成する文字、部分文字列の特徴量に重み付けをする入力画像重み付け手段と、特徴合成部で生成した文字、部分文字列の特徴量に重み付けをする特徴合成重み付け手段および入力画像重み付け手段により抽出された特徴量を特徴合成重み付け手段により抽出された特徴量と照合する照合手段を有する特徴照合部をさらに備えた構成の単語認識装置。
【0034】
この構成により、単語を構成する特定の文字、または特定の部分文字列が同一の単語に対して、同一部の特徴量の重み付けを低くし、他の文字または部分文字列の特徴量を上げることにより、類似単語の特徴量の差が明確になり、認識精度が高まる。
【0035】
【発明の実施の形態】
実施例1の単語認識装置1の構成図を図1(a)に示す。
【0036】
画像入力部2、個別文字認識部21、単語認識部22、確信度算出部10、確信度比較部11、認識結果出力部6、個別文字辞書7より構成される。
【0037】
個別文字認識部21は、正規化部3、特徴抽出部4、特徴照合部5より構成される。
【0038】
また単語認識部22は、正規化部3、特徴抽出部4、特徴照合部5、特徴合成部8、単語リスト部9より構成される。
【0039】
個別文字認識部21、単語認識部22は従来例と同一である。確信度算出部10は、個別文字認識部21からの単語を構成する文字毎の確信度の算出および平均の算出と、単語認識部22からの単語の確信度を算出する。確信度比較部11は、個別文字認識部21の確信度と単語認識部22の確信度の大小を比較する。確信度とは、入力画像の特徴量との類似度が高いことを意味する。
【0040】
個別文字認識処理と単語一括認識処理の併用の装置であり、画像入力部2で入力された手書き文字は、各認識部で、文字および単語の認識が行われる。そしてその認識結果の確信度を求める。
【0041】
確信度の算出方法は、以下のようにする。
【0042】
まず入力画像の特徴量を示す特徴ベクトルを抽出する。
次に個別文字認識部21は、辞書内の文字の特徴量を示す特徴ベクトルを求め、入力画像の特徴ベクトルとの差の距離値を求める。単語を構成するすべての文字について行う。
【0043】
また、単語認識装置1は、特徴合成部8で合成された単語の特徴量を示す特徴ベクトルを求め、入力画像の特徴ベクトルとの差の距離値を求める。
【0044】
次に予め、大量のサンプルを用いて、距離値の分布を調べ、分布の範囲が0〜1に収めるように正規化してあるので確信度算出部10は、算出した各認識部の距離値から分布上の距離値に変換する。その分布をf(X )で表すとすると距離値がdであったときの確信度R(d)は、以下の式で表される。距離値dは、0≦d≦1であり、d=1のときを最大の類似度と見る。
【0045】
【数式1】
Figure 0004237864
【0046】
そして例えば2文字構成の単語の場合、個別文字認識部21からは文字毎の確信度の平均であるR(d1)+R(d2)/2を求める。次に単語認識部22からは単語の確信度からはR(d3)を求める。確信度比較部はその大小を比較する。その結果確信度の大きいものを認識結果として認識結果出力部6から出力する。
【0047】
実施例2の単語認識装置1の構成図を図2に示す。
【0048】
画像入力部2、文字間隔検出部12、閾値比較部13、個別文字認識部21、単語認識部22、認識結果出力部6、個別文字辞書7より構成される。
【0049】
個別文字認識部21は、正規化部3、特徴抽出部4、特徴照合部5より構成される。
【0050】
また単語認識部22は、正規化部3、特徴抽出部4、特徴照合部5、特徴合成部8、単語リスト部9より構成される。
個別文字認識部21、単語認識部22は従来例と同一である。文字間隔検出部12は、入力された画像の文字間の間隔を検出する。閾値比較部13は、文字間隔検出部12で検出された間隔を閾値と比較する。
【0051】
実施例2の処理は、2つの認識処理を通すため処理時間がかかるため速い処理速度が要求される場合に使用する。まず入力された単語の文字間隔を検出し、文字間隔が閾値より大きいか小さいかにより、2つの認識処理を使い分ける。
【0052】
図2を参照して動作を説明する。
【0053】
画像入力部2から入力された画像が和歌山とすると、文字間隔検出部12で文字間隔を検出する。例えば、連結する黒画素から文字の外接矩形を求め、その外接矩形間を文字間隔として検出する。その検出結果が、閾値より小さければ、文字間が近接している可能性が高いため単語認識部22にて処理を行う。検出結果が、閾値より大きければ、近接していないと判断し、個別文字単位での個別文字認識部21にて処理を行う。
【0054】
実施例3の単語認識装置1の構成図を図3に示す。
【0055】
単語認識装置1は、画像入力部2、正規化部3、特徴抽出部4、認識処理部17からなる。認識処理部17は、特徴照合部5、特徴合成部8、認識結果出力部6、単語リスト部9、個別文字辞書7、単語辞書16を備える。
【0056】
画像入力部2は、スキャナなどから手書き文字の入力画像を取得とともに単語の傾斜度を検出する。正規化部3は、文字の大きさ、位置を一定に揃える。特徴抽出部4は、入力画像から特徴量を抽出する。特徴合成部8は、単語を選択し、選択された単語を構成する個々の文字の特徴量を個別文字辞書7から抽出し、単語を構成する部分文字列の特徴量を単語辞書16から抽出し合成する。また文字、部分文字列サイズ変換、複雑度変換、傾き処理等を行う。特徴照合部5は、特徴合成部8が合成した単語の特徴量と特徴抽出部4が抽出した入力画像の特徴量と照合する。単語リスト部9は、複数の単語リストからなる。認識結果出力部6は、特徴照合部5で照合した結果の中で最も類似した特徴量を持つ単語をディスプレイなどに出力する。個別文字辞書7は、文字とその特徴量とその画像から構成される。単語辞書16は、複合語の共通の部分文字列とその特徴量からなる。
【0057】
図3〜図6を参照して、単語認識装置1の動作について説明する。
【0058】
まず入力画像として「東京」が入力された場合について、図4(b)の住所例により説明する。
【0059】
都道府県などのキーとなる文字は、規定の座標に印刷されているものとする。画像入力部2は入力された画像について、まず都道府県のキーとなる文字が印刷されている位置を検出し、その前の文字列を切り出す。次に連結した黒画素を抽出して、それに外接する矩形を得る。得られたすべての外接矩形の中心に対しての直線を設定する。そしてその傾きを単語の傾きとし、所定の閾値と比較する。
【0060】
傾斜度<閾値の場合と傾斜度≧閾値の場合に分けて説明を行う。
(1)傾斜度<閾値の場合
入力された「東京」の文字列に対して、正規化部3で、例えば64×64画素への正規化が完了すると、特徴抽出部4で「東京」の入力画像の特徴量が抽出される。都道府県の単語リストには、北海、東京、沖縄等都道府県の単語が登録されており、個別文字辞書7には、すべての文字の特徴量が登録されている。
【0061】
次に認識処理部17の処理の流れを図4(a)に示す。
【0062】
個別文字についての説明であるが、部分文字列も同様である。
【0063】
まず、特徴合成部8は単語リストに従って、まず「北海」の単語を検索する。(S11ステップ)次に個別文字辞書7より「北」の特徴量および「海」の特徴量を抽出して特徴量の合成を行うがその方式として3種類の方式が有る。特徴合成後の特徴ベクトルの次元数と入力画像の正規化の次元数とが等しくなるように特徴合成の処理がされる。
【0064】
特徴量としてメッシュ特徴量を用いた場合を示す。メッシュ特徴量とは、画像をm×nにメッシュで分割したときに各小矩形内の黒画素数を小矩形サイズで割ったものがその小矩形内の特徴量となる。例えば正規化サイズが64×64画素だとすると8×8メッシュに分割した小矩形のサイズは8×8となる。ある小矩形内に32個の黒画素があるとするとそのメッシュ特徴量は32/64=0.5となる。入力画像は、64×64画素で8×8メッシュで正規化され特徴量を抽出しているので、特徴合成結果も、64×64画素で8×8メッシュになるように合成される。
【0065】
第1の方式は縮小文字サイズを有する個別文字辞書7による特徴合成である。(図4のS121 ステップ)。説明図を図5(a)に示す。
【0066】
OCR専用機など高速で辞書用のメモリ容量が大きく取れるものに、使用される。
【0067】
1つの文字、部分文字列について、複数の文字サイズから抽出した特徴量をそれぞれ個別文字辞書7として持つ。1/2サイズの縮小文字を有する個別文字辞書7を用いた例を示す。1/2サイズの縮小文字は、8×4メッシュとなる。
【0068】
都道府県の単語リストに基づいて「北海」の1/2サイズの「北」、1/2サイズの「海」の特徴量を個別文字辞書7から抽出し、合成して8×8メッシュサイズの「北海」の単語の特徴量とする。(S13ステップ)
この単語特徴量と、入力画像の特徴量と照合してその差を記憶する。(図4のS14ステップ)
第2の方式は、文字サイズ変換方式の特徴合成である。(図4のS122 ステップ)携帯情報端末など辞書用のメモリ容量を大きくとれないものに使用される。
【0069】
本方式は、標準の文字サイズの特徴量に変換係数を施して種々の文字サイズの特徴量を生成し、単語特徴量を合成する方式である。特徴量合成の説明図を図5(b)に示す。
【0070】
標準の文字サイズの特徴量に変換係数を施して縮小した文字サイズの特徴量を合成する。
【0071】
例えば64×64画素の標準の文字サイズの特徴量は、縦8×横8メッシュなので、「 北」の標準の文字サイズに縦8×横4の変換係数をかけることにより1/2サイズの「 北」の文字の特徴量が得られる。又、「 海」の標準の文字サイズに縦8×横4の変換係数をかけることで、1/2サイズの「 海」の文字の特徴量が得られる。両者を合成したものを「北海」の単語特徴量とする。(図4のS13ステップ)この単語特徴量と入力画像の特徴量と照合してその差を記憶する。(図4のS14ステップ)
第3の方式は複雑度変換方式の特徴合成である。(図4のS123 ステップ)
携帯情報端末など辞書用のメモリ容量を大きくとれないもので、認識精度を高くしたい装置に使用される。
【0072】
精度の高い処理を行うには、まず単語の構成する文字の複雑度を調べる。複雑度としては、例えば縦方向の線密度を用いた線密度算出の説明図を図5(c)に示す。各文字の線密度の総和の比に応じて、特徴量に重みづけをして単語特徴量を合成する方法である。
【0073】
例えば「北海」という単語に対して「北」の線密度が30、「海」の線密度が50だとすると、このときの文字サイズを64×64画素とすると8×8のメッシュに分割されているので、「北」の特徴量は横のメッシュ数を8×30/(30+50)=3 とし、「海」の特徴量は、横のメッシュ数を8×50/(30+50)=5とする。そして、「 北」の標準の文字サイズに縦8×横3の変換係数をかけることにより「 北」の文字の特徴量が得られる。又「 海」の標準の文字サイズに縦8×横5の変換係数をかけることで、「 海」の文字の特徴量が得られる。両者を合成したものを「北海」の単語特徴量とする。(図4のS13ステップ)
この単語特徴量と入力画像の特徴量と照合してその差を記憶する。(図4のS14ステップ)
これらの処理をすべての単語について実施し、最終的に入力画像の特徴量と特徴合成部8からの特徴量との差が最小値の特徴量のものを認識結果として出力する。(図4のS15ステップ)
また、図示はしていないが、単語の中には、太秦馬塚、太秦垣内のように、同一部分文字列を含む複合語が多数存在する。そこで特徴量合成時に毎回「太」と「秦」から「太秦」を合成するのではなく、予め「太秦」ついては、例えば単語辞書16より1/2文字サイズの特徴量を抽出する。そして、個別文字辞書7から1/4サイズの「馬」+1/4サイズの「塚」の文字の特徴量を抽出し、「太秦」+「馬」+「塚」の特徴量から単語特徴量を合成する方式である。
(2)傾斜度≧閾値の場合。
【0074】
図6に傾斜度≧閾値の場合の認識処理部17の説明図を示す。
【0075】
図6(a)は、処理の流れ、図6(b)に住所例を示す。
【0076】
住所例で「東京」という入力画像の文字列を抽出後、正規化部3で、傾斜のある単語として正規化を行ったあと特徴抽出部4で特徴抽出を行う。
次に、都道府県の単語リストから単語「北海」を取得し、単語を構成する文字をキーにして、個別文字辞書7から「北」と「海」の画像を取得する。(S51ステップ)取得された画像を傾斜度θに沿って配置する。(S52ステップ)
次に、その画像を入力画像の正規化サイズと同一のサイズに正規化する。(S53ステップ)正規化された単語画像をもとに特徴抽出を行う。(S54ステップ)
この抽出された特徴量と入力画像から抽出された特徴量とを比較し差分を記憶する。(S55ステップ)
以上の処理を単語リストの全単語について実施する。全単語の中で、差分の最小値のものを認識出力部から出力する。(S56ステップ)
また図示はしていないが、特徴照合部5において、例えば入力された単語が住所であり、「太秦○○」のどれかであると予めわかっているような場合は、「太秦」部分は、照合のための有効な特徴とならない。そこで、この部分の特徴量の重みを低くするかマスクしておき、それ以外の成分の重みを高くするか、そのままにして照合を行うことで、類似単語の特徴量の差を明確化する。これにより認識精度が高まる。
【0077】
例えば入力画像が「太秦馬塚」だとすると、この文字列を切りだし、共通文字の部分「太秦」をマスクして残りの文字「馬塚」の部分のみで特徴抽出を行う。そして、次に単語リストから「太秦○○」を抽出する。例えば抽出した単語が「太秦垣内」であれば、「太秦」をマスクする。そして残りの「垣内」の部分の特徴量の合成をする。そして入力画像の特徴量と特徴合成した特徴量との照合を行う。この照合を単語リストの中の太秦を含む複合語のすべてについて行い、特徴量の差が最も小さいものを入力単語として特定する。
【0078】
【発明の効果】
本発明によれば、単語が傾斜していても単語認識が可能であり、また単語を構成する文字が異なる文字サイズにおいても認識が可能である。
【0079】
また、文字数に応じた文字サイズの選択による特徴量の合成により、単語認識精度を向上できる。さらに傾いた単語に対しても画像合成による特徴量抽出により単語の認識精度を高める。さらに複合語の場合の共通の部分文字列または文字の特徴を予め保持することにより、特徴合成のときの処理を高速化することができる。
【0080】
また同一の文字または同一の部分文字列からなる単語間での特徴量に重み付けをすることで、誤読を減少することができる。
【図面の簡単な説明】
【図1】 実施例1の単語認識装置の構成図
【図2】 実施例2の単語認識装置の構成図
【図3】 実施例3の単語認識装置の構成図
【図4】 実施例3の傾斜度<閾値の時の認識処理部の説明図
【図5】 実施例3の特徴量合成の説明図
【図6】 実施例3の傾斜度≧閾値の時の認識処理部の説明図
【図7】 従来例の個別文字認識装置の構成図
【図8】 従来例の単語認識装置の構成図
【符号の説明】
1 単語認識装置
2 画像入力部
3 正規化部
4 特徴抽出部
5 特徴照合部
6 認識結果出力部
7 個別文字辞書
8 特徴合成部
9 単語リスト部
10 確信度算出部
11 確信度比較部
21 個別文字認識部
22 単語認識部

Claims (1)

  1. 個別文字とその特徴量を格納する辞書と、
    入力画像の単語を構成する個々の文字の特徴量と辞書の中の個々の文字の特徴量とを照合して単語を認識する個別文字認識部と、
    前記入力画像と同一の入力画像から単語の特徴量を抽出した結果と、辞書の個々の文字の特徴量から単語の特徴量を合成した結果とを照合することで単語を認識する単語認識部と、
    個別文字認識部の認識結果からの単語の確信度の算出と単語認識部の認識結果からの単語の確信度の算出とを行う確信度算出部と、
    確信度算出部で算出された個別文字認識部と単語認識部の確信度算出結果を比較する確信度比較部とを備え、
    確信度比較部は、確信度の比較結果に基づき、個別文字認識部と単語認識部の確信度の大きい方を選択することを特徴とする単語認識装置。
JP11373399A 1999-04-21 1999-04-21 単語認識装置 Expired - Fee Related JP4237864B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11373399A JP4237864B2 (ja) 1999-04-21 1999-04-21 単語認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11373399A JP4237864B2 (ja) 1999-04-21 1999-04-21 単語認識装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2006119744A Division JP4201013B2 (ja) 2006-04-24 2006-04-24 単語認識装置

Publications (2)

Publication Number Publication Date
JP2000306045A JP2000306045A (ja) 2000-11-02
JP4237864B2 true JP4237864B2 (ja) 2009-03-11

Family

ID=14619769

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11373399A Expired - Fee Related JP4237864B2 (ja) 1999-04-21 1999-04-21 単語認識装置

Country Status (1)

Country Link
JP (1) JP4237864B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7024042B2 (en) 2000-10-04 2006-04-04 Fujitsu Limited Word recognition device, word recognition method, and storage medium
JP2005352653A (ja) * 2004-06-09 2005-12-22 Omron Corp 文字認識装置
CN100555308C (zh) * 2005-07-29 2009-10-28 富士通株式会社 地址识别装置和方法
JP4849883B2 (ja) * 2005-12-16 2012-01-11 富士通株式会社 行方向判定プログラム、方法及び装置
JP4549400B2 (ja) 2008-03-04 2010-09-22 富士通株式会社 文書認識プログラム、文書認識装置、および文書認識方法
JP4661924B2 (ja) 2008-09-12 2011-03-30 カシオ計算機株式会社 辞書機能を備えた電子機器およびプログラム
WO2017104805A1 (ja) * 2015-12-18 2017-06-22 国立大学法人東京農工大学 プログラム、情報記憶媒体及び文字列認識装置

Also Published As

Publication number Publication date
JP2000306045A (ja) 2000-11-02

Similar Documents

Publication Publication Date Title
US8160402B2 (en) Document image processing apparatus
US8208765B2 (en) Search and retrieval of documents indexed by optical character recognition
KR100292098B1 (ko) 문자 인식 장치 및 방법
EP0355748A2 (en) A pattern recognition apparatus and method for doing the same
US8315465B1 (en) Effective feature classification in images
JP4796169B2 (ja) デジタル画像の向きの判定方法
Puigcerver et al. ICDAR2015 competition on keyword spotting for handwritten documents
JP2008171379A (ja) 画像文書処理装置、画像文書処理方法、プログラム、及び記録媒体
KR20110028034A (ko) 라벨 검색 방법 및 장치
KR20130029430A (ko) 문자 인식 장치, 문자 인식 방법, 문자 인식 시스템, 및 문자 인식 프로그램
EP2497053A2 (en) System and method for increasing the accuracy of optical character recognition (ocr)
JP4772817B2 (ja) 画像文書処理装置および画像文書処理方法
JP2010217996A (ja) 文字認識装置、文字認識プログラム、および文字認識方法
JP4237864B2 (ja) 単語認識装置
WO2002019248A9 (en) Character recognition system
US5937093A (en) Pattern recognition methods and apparatus to reduce processing time by groupnise comparison of features and coordinated dynamic elimination of candidates
JP4201013B2 (ja) 単語認識装置
CN110796134A (zh) 一种强噪声复杂背景图像中的汉字组词方法
CN112926603B (zh) 乐谱识别方法、装置、设备及存储介质
US6859556B2 (en) Word recognizing apparatus for dynamically generating feature amount of word and method thereof
Mao et al. A system for cursive handwritten address recognition
JP3879341B2 (ja) 単語認識装置
JPH05174187A (ja) 文字認識装置
JP2001147990A (ja) 画像データ処理装置及び方法並びにこれに利用される記憶媒体
JPH0935006A (ja) 文字認識装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060307

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060424

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060627

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060818

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20060904

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20060922

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081219

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111226

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111226

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121226

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121226

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131226

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees