JP2003022417A - 文字列認識装置 - Google Patents

文字列認識装置

Info

Publication number
JP2003022417A
JP2003022417A JP2001209362A JP2001209362A JP2003022417A JP 2003022417 A JP2003022417 A JP 2003022417A JP 2001209362 A JP2001209362 A JP 2001209362A JP 2001209362 A JP2001209362 A JP 2001209362A JP 2003022417 A JP2003022417 A JP 2003022417A
Authority
JP
Japan
Prior art keywords
character string
character
recognition
reliability
strings
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001209362A
Other languages
English (en)
Inventor
Yasushi Ishizuka
康司 石塚
Tadashi Hirose
斉志 広瀬
Koichi Sugiyama
晃一 杉山
Satoru Suzuki
哲 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2001209362A priority Critical patent/JP2003022417A/ja
Publication of JP2003022417A publication Critical patent/JP2003022417A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 文字列の認識精度を高める。 【解決手段】 文字列パターンデータが入力されると
(S201とS202)、認識候補文字列が得られて、
認識候補文字列は該文字列中の文字の総数で、対応の文
字信頼度の総和を除した値である文字列信頼度に従い順
位付けられる(S203〜S205)。特定順位に付け
られた認識候補文字列と特定順位以外に付けられた認識
候補文字列とは、両者において相違する部分文字列につ
いての文字列信頼度に従い再度、順位付けされる(S2
06とS207)。それゆえに、認識の確からしさを示
す文字列信頼度は、文字総数で対応の文字信頼度の総和
を除して得られる値、すなわち入力文字列中の文字数の
多少に依存しない正規化された値であるから、認識候補
文字列は認識精度に従う正確な順位付けにて出力され
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は文字列認識装置に
関し、特に、パターン認識を利用した文字列認識装置に
関する。
【0002】
【従来の技術】従来からコンピュータで文字認識を行な
う装置は数多く提案されている。活字文字を対象とする
活字OCR(光学的文字読取装置)は、文字がほぼ一定
のピッチで印字されていることを利用して文字分割位置
を固定にして文字の切出しを行ない、切出された文字領
域に対して文字認識を行なうようにしている。また文字
認識結果が妥当でないと判断される場合には、再び文字
切出しを行なう処理が追加されることも多い。
【0003】ペンとタブレットを用いて手書き入力され
る文字によるオンライン文字認識手法では特開平8−2
49424号公報に開示のような、記入枠を用いた方法
が実用化されている。記入枠を用いないオンライン文字
認識手法として活字OCRと同様に文字分割位置を固定
にして文字の切出しを行ない、切出された各文字領域に
対して文字認識を行ない、認識結果の文字列候補を求め
る方法がある。この方法では文字切出しでのミスが認識
ミスに直結する。
【0004】上述の課題を解消するために、すべての文
字分割位置で完全に文字分割をせず、分割位置のパター
ン文字領域を切出す手法がある。このような手法に従い
切出された文字領域に対して文字認識を行ない文字領域
の重なりがない文字列についてすべての文字認識結果を
文字数で正規化した後、認識文字候補の順位付けが行な
われる。
【0005】また、特開2000−215270号公報
に示されるように文字列ごとに単語辞書を検索し、該文
字列に続く複数の文字列を予測し認識候補文字列の順位
を変更する手法も提案されている。
【0006】
【発明が解決しようとする課題】手書きまたはスキャナ
などで入力された文字列について文字パターンを文字単
位に切出して、文字認識を行ない文字認識結果から求め
られる複数の文字列候補の文字列信頼度を用いて、文字
列候補の順位を判定する手順について説明する。文字信
頼度は文字認識結果の信頼性を示す数値であって、たと
えば入力文字パターンと辞書に予め登録された正規の文
字パターンとを照合してその照合結果を示す距離などの
情報から求められる値である。認識結果の文字列候補は
認識結果の文字信頼度を用いて、最も信頼度が高くなる
ように計算する。
【0007】この文字列候補を生成する場合において、
単純に文字信頼度の合計を用いると、含まれる文字数が
多い文字列候補ほど上位になりやすい。そのため、含ま
れる文字数で正規化を行なうのが一般的である。文字列
候補に含まれる文字信頼度の合計を、該文字列候補に含
まれる文字数で除算することで正規化を行なう。この場
合、全体としての精度が高く特定部分の精度が低い場合
など、ある文字列候補の特定部分の文字信頼度が、他の
文字列候補の相当する部分の文字信頼度よりも大きいに
もかかわらず上位候補とならない場合がある。具体的な
例が表1に示される。
【0008】
【表1】
【0009】表1では、入力文字列「新品ワイングラス
に」について認識した結果、文字列候補「新品ワイングラ
ス1こ」と「新品ワイングラスに」が得られたことが示さ
れる。各文字列候補の文字信頼度は、文字認識の結果に
よりその候補の文字が最も確実性がある場合を100、
全く確実性がない場合を0となるような、0〜100の
値で表現される。各文字列候補の文字列信頼度には、対
応の文字列候補に含まれる各文字の文字信頼度の合計を
文字数で除算することで文字数による正規化を行なった
値が用いられる。
【0010】この例における文字列信頼度に従い文字列
候補の順位付けを行なった場合、誤った認識結果である
「新品ワイングラス1こ」という文字列候補が正しい認
識結果である「新品ワイングラスに」という文字列候補
よりも上位候補となる。
【0011】しかしながら、この2つの文字列候補の相
違部分の「1こ」と「に」の各文字の文字信頼度を示す
値は「1」が89および「こ」が84であるのに対して
「に」は90であるから、「に」の方が文字信頼度が高
い。すなわち、この例においては、高い文字信頼度の
「に」を含む文字列候補よりも文字信頼度が低い「1
こ」を含む文字列候補の方が上位候補であると判定され
てしまう。その結果、誤った認識結果である候補文字列
が正しい認識結果の候補文字列よりも上位候補となると
いう誤判定がなされる。
【0012】さらに表1で示されるように、誤認識され
た文字列候補は日本語としても正しいものであるから、
前後の文字との遷移確率や、形態素解析を用いた意味解
析などに基づく言語的処理では改善を期待することはで
きない。また特開2000−215270号公報におけ
る、辞書を検索し文字列を予測し順位を入換える方法で
は文字認識の結果に差があっても過去に入力した文字列
が上位候補に選択されてしまう。
【0013】それゆえにこの発明の目的は、認識精度の
高い文字列認識装置を提供することである。
【0014】
【課題を解決するための手段】この発明のある局面に係
る文字列認識装置は、文字列によるパターンデータを入
力し1文字領域ごとにパターン認識して、認識結果文字
とそれである確からしさを示す文字信頼度とを検出する
文字認識手段と、文字認識手段により1文字領域に対応
して検出された認識結果文字を、文字列の全ストローク
それぞれがいずれかの1文字領域に1回だけ含まれるよ
うに組合せて複数の認識候補文字列を生成する文字列生
成手段と、文字列生成手段により生成された複数の認識
候補文字列それぞれについて、それである確からしさを
示す文字列信頼度を得て、複数の認識候補文字列を文字
列信頼度に従い順位付けして出力する順位付け手段と、
順位付け手段により特定順位に付けられた認識候補文字
列と特定順位以外に付けられた認識候補文字列とを、両
者において相違する部分文字列について得られる文字列
信頼度に従い再度、順位付けして出力する再順位付け手
段とを備えて、文字列信頼度は、対応の文字列に含まれ
る前記認識結果文字の前記文字信頼度に基づいて正規化
された値を含む。
【0015】したがって、文字列によるパターンデータ
が入力されると、認識候補文字列が得られて、認識候補
文字列は対応の文字列に含まれる前記認識結果文字の前
記文字信頼度に基づいて正規化された値を含む文字列信
頼度に従い、順位付け手段により順位付けられる。再順
位付け手段は、特定順位に付けられた認識候補文字列と
特定順位以外に付けられた認識候補文字列とを、両者に
おいて相違する部分文字列について得られる文字列信頼
度に従い再度、順位付けする。
【0016】それゆえに、認識候補文字列の認識の確か
らしさを示す文字列信頼度は、正規化された値であるか
ら、言換えると入力された文字列に含まれる文字数の多
少に依存しない値であるから、入力された文字列または
相違する部分文字列に含まれる文字数によらず認識候補
文字列を文字列信頼度に従いより正確に順位付けでき
て、認識精度は高くなる。
【0017】また、再順位付け手段により、特定順位の
認識候補文字列と特定順位以外の認識候補文字列とは、
両者において相違する部分文字列の文字列信頼度に従い
再度順位付けされるから、より正確な順位判定が可能と
なり、認識精度は高くなる。
【0018】上述の文字列認識装置では文字列信頼度
は、対応の文字列に含まれる認識結果文字の総数で、対
応の文字信頼度の総和を除した値を含むようにしてもよ
い。
【0019】それゆえに、認識候補文字列の認識の確か
らしさを示す文字列信頼度は、認識結果文字の総数で対
応の文字信頼度の総和を除して得られる正規化された値
であるから、言換えると入力された文字列に含まれる文
字数の多少に依存しない値であるから、入力された文字
列または相違する部分文字列に含まれる文字数によらず
認識候補文字列を文字列信頼度に従いより正確に順位付
けできて、認識精度は高くなる。
【0020】上述の文字列認識装置では、再順位付け手
段は、順位付け手段により第1位に付けられた認識候補
文字列と第1位以降に付けられた認識候補文字列とを、
両者において相違する部分文字列について得られる文字
列信頼度に従い再度、順位付けするようにしてもよい。
【0021】したがって、第1位の認識候補文字列と第
1位以降の認識候補文字列とについてのみ再順位付けが
行なわれるから、再順位付けに関する処理量を少なくで
きて、装置構成に制約がある場合でも例えば携帯型端末
(携帯型電話などを含む)であっても十分な処理速度と
正確な順位付けとを得ることができる。
【0022】上述の文字列認識装置では再順位付け手段
は、順位付け手段により各順位に付けられた認識文字列
候補と該順位以降に付けられた認識文字列候補とを、両
者において相違する部分文字列について得られる文字列
信頼度に従い再度、順位付けするようにしてもよい。
【0023】したがって、各順位に付けられた認識文字
列候補と該順位以降に付けられた認識文字列候補とにつ
いて再順位付けが行なわれるから、再順位付けを厳密に
行なうことができて、より高い認識精度が得られる。
【0024】上述の文字列認識装置では、パターンデー
タは、文字列が手書き入力されて得られる筆跡の座標デ
ータであってよい。
【0025】したがって、ペンなどを用いて文字列を手
書き入力するだけで、その筆跡の座標データはパターン
データとして文字列認識されて、複数の認識候補文字列
を文字列信頼度に従い順位付けして出力できる。
【0026】上述の文字列認識装置では、複数認識候補
文字列は文字列信頼度に従い順位付けして表示されるよ
うにしてよい。したがって、ユーザは、文字列信頼度に
従い順位付けされた複数認識候補文字列を表示により確
認できる。
【0027】上述の文字列認識装置において文字列信頼
度はさらに、対応の文字列に含まれる1文字領域ごとの
文字の形状特徴に基づく評価値に基づいて正規化された
値を含んでもよい。
【0028】したがって、複数認識候補文字列を順位付
けするための文字列信頼度に、文字の形状特徴に基づく
評価値に基づいて正規化された値が含まれることになっ
て、より確かな文字列信頼度が得られて、結果として高
い認識精度を得ることができる。
【0029】上述の文字列認識装置では、文字列信頼度
はさらに、対応の文字列に含まれる1文字領域ごとの文
字の形状特徴に基づく評価値の総和を認識結果文字の総
数で除して得られる値を含むようにしてもよい。
【0030】上述の文字列認識装置では、文字列信頼度
はさらに、対応の文字列に含まれる文字と次位に位置す
る文字との組合せとなる確率値に基づいて正規化された
値を含むようにしてもよい。
【0031】上述の文字列認識装置では、文字列信頼度
はさらに、対応の文字列に含まれる文字と次位に位置す
る文字との組合せとなる確率値の総和を認識結果文字の
総数で除して得られる値を含むようにしてもよい。
【0032】したがって、複数認識候補文字列を順位付
けするための文字列信頼度に、文字の組合せとなる確率
値による信頼度が含まれることになって、より確かな文
字列信頼度が得られて、結果として高い認識精度を得る
ことができる。
【0033】上述の文字列認識装置では、再順位付け手
段は、外部から与えられる指示入力に応答して順位付け
するようにしてもよい。
【0034】したがって、ユーザの指示入力に応答して
再順位付け処理が実行されるから、ユーザは指示入力す
ることで、再順位付けしてより高い認識精度を得る処理
と再順位付けは省略してより早い処理とのいずれかを任
意に選択できる。
【0035】上述の文字列認識装置では、特定順位に付
けられた認識候補文字列と特定順位以外に付けられた認
識候補文字列とは、外部からの入力により指定されるよ
うにしてよい。
【0036】したがって、ユーザは、順位付けされた認
識候補文字列のうち、再順位付け手段による再順位付け
が施されるべき特定順位の認識候補文字列と特定順位以
外の認識候補文字列を、外部入力により指定できる。そ
れゆえに、ユーザの判断により指定された認識文字列候
補について再順位付けが施されるから、ユーザ判断を反
映したより正確な順位付けが期待できる。
【0037】この発明のさらなる他の局面に係る文字列
認識方法は、文字列によるパターンデータを入力し1文
字領域ごとにパターン認識して、認識結果文字とそれで
ある確からしさを示す文字信頼度とを検出する文字認識
ステップと、文字認識ステップにより1文字領域に対応
して検出された認識結果文字を、文字列の全ストローク
それぞれがいずれかの1文字領域に1回だけ含まれるよ
うに組合せて複数の認識候補文字列を生成する文字列生
成ステップと、文字列生成ステップにより生成された複
数の認識候補文字列それぞれについて、それである確か
らしさを示す文字列信頼度を得て、複数の認識候補文字
列を文字列信頼度に従い順位付けして出力する順位付け
ステップと、順位付けステップにより特定順位に付けら
れた認識候補文字列と特定順位以外に付けられた認識候
補文字列とを、両者において相違する部分文字列につい
て得られる文字列信頼度に従い再度、順位付けして出力
する再順位付けステップとを備えて、文字列信頼度は、
対応の文字列に含まれる認識結果文字の文字信頼度に基
づいて正規化された値を含むことを特徴とする。
【0038】この発明のさらなる他の局面に係る記録媒
体は、上述の文字列認識方法をコンピュータに実行させ
るためのプログラムが記録された、機械読取可能な記録
媒体である。
【0039】この発明のさらなる他の局面に係るプログ
ラムは、上述の文字列認識方法をコンピュータに実行さ
せるためのプログラムである。
【0040】
【発明の実施の形態】以下、この発明の各実施の形態に
ついて説明する。
【0041】(実施の形態1)本実施の形態1では、ペ
ン入力による手書き文字列を認識する手書き文字列認識
装置が示される。ここでは文字列入力方法を手書き入力
としているが、これに限定されない。
【0042】図1は、この発明の実施の形態1に係る手
書き文字列認識装置のブロック図である。手書き文字列
認識装置は、筆記したストロークの筆跡データを検出す
るストローク入力部1、入力された筆跡データから文字
に相当する部分の文字候補領域を文字単位に切出す文字
切出し部2、文字認識部3、文字列生成部4、生成され
た文字列の順位を判定する文字列順位判定部5、ストロ
ーク入力部1で入力された筆跡および文字列認識結果な
どの情報を表示するための表示部6、各文字について正
規の文字パターン(以下、辞書パターンという)が登録
されている照合用辞書7および文字間の遷移確率をテー
ブル形式で登録した言語処理辞書8を含む。
【0043】文字認識部3は、文字切出し部2で文字単
位に切出された矩形の文字候補領域に含まれる文字パタ
ーンについて、照合用辞書7に登録された辞書パターン
それぞれと照合を行ない、照合結果、最も確からしい辞
書パターンに対応の文字を認識文字候補として生成す
る。
【0044】文字列生成部4は、文字認識部3が生成し
た認識文字候補に基づき言語処理辞書8を参照して言語
処理を行ない1つ以上の認識文字列の候補を生成して順
位付けして出力する。
【0045】文字切出し部2〜文字列順位判定部5はプ
ログラムにより実現される。図2は、図1の手書き文字
列認識装置が搭載されるコンピュータの構成図である。
【0046】図2を参照してコンピュータは、該コンピ
ュータ自体を集中的に制御するためのCPU(中央処理
装置の略)122、ROM(Read Only Memory)また
はRAM(ランダムアクセスメモリの略)を含んで構成
されるメモリ124、固定ディスク126、FD(フレ
キシブルディスク)132が着脱自在に装着されて、装
着されたFD132をアクセスするFD駆動装置13
0、CD−ROM(Compact Disc Read Only Memor
y)142が着脱自在に装着されて、装着されたCD−
ROM142をアクセスするCD−ROM駆動装置14
0、CRT(陰極線管)や液晶ディスプレイなどからな
る表示部6に対応するモニタ110、キーボード15
0、マウス160、ストローク入力部1に対応するペン
タブレット170、インターネットなどの各種の通信回
線が適用可能な通信ネットワーク182と該コンピュー
タとを通信接続するための通信インターフェィス180
を含む。これらの各部はバスを介して通信接続される。
【0047】コンピュータには、カセット形式の磁気テ
ープが着脱自在に装着されて磁気テープをアクセスする
磁気テープ装置が設けられても良い。
【0048】なお、図1の照合用辞書7および言語処理
辞書8はメモリ124または固定ディスク126に予め
登録される。
【0049】また、ペンタブレット170のタブレット
とモニタ110の液晶ディスプレイによる表示パネルと
は一体的に構成されてもよい。その場合には、ペンを用
いてタブレット上に手書き文字列を入力すると、リアル
タイムにその筆跡が表示されるとともに、該筆跡の座標
データをパターン認識などして得られる最終の認識結果
も同一表示画面にて表示されることになるから、筆記者
は、手書き入力した文字列と認識結果とを同時に確認で
きて、入力文字列に対して認識結果が適当であるか否か
を速やかに判断できる。
【0050】図3は、この発明の実施の形態1に係る手
書き文字列認識処理のフローチャートである。図4
(A)〜(D)は、図1の文字切出し部2の手順を説明
する図である。図3のフローチャートに従い横書きで1
行の文字列が手書き入力された場合の処理を説明する
が、縦書きであっても同様に適用できる。
【0051】まず、筆記者は、ストローク入力部1の入
力用ペンを用いて文字列を手書き入力する(ステップS
(以下、単にSと略す)201)。文字切出し部2は、手
書き入力された文字列について文字候補領域を以下のよ
うに抽出する。
【0052】まず、手書き入力された文字の各ストロー
クの筆跡をxおよびy軸からなる座標列データとして抽
出する(S202)。
【0053】次に、文字の切出しを行なう(S20
3)。具体的には、抽出されたすべてのストロークの座
標列データに対して縦方向(y軸方向)の投影を行なう
(図4(A)と(B)参照)。この投影で、座標列デー
タが存在しない部分を文字の区切りの位置候補として抽
出する。そして、抽出された文字区切り位置候補を組合
せて、1画以上のストロークからなる矩形の文字領域を
示す文字矩形候補を生成する(図4(C)参照)。この
とき文字矩形候補それぞれについて、その縦横比がある
しきい値、たとえば1:2より横長である場合は文字矩
形である可能性がないと判断し文字矩形候補から削除す
る。このようにして、合計13個の文字矩形候補が抽出
される(図4(D)に参照)。抽出された文字矩形候補
は文字候補領域として出力される。
【0054】次に、文字認識部3により文字認識が行な
われる(S204)。具体的には、文字切出し部2から
出力された文字候補領域それぞれについて、たとえば特
開平8−249424号公報に示される手法で、対応の
座標列データから抽出した特徴列パターンと照合用辞書
7に登録された座標パターンである辞書パターンそれぞ
れとの照合を行ないマッチング距離(以下、単に距離と
いう)を求め、その距離が最も小さい辞書パターンに対
応して登録された文字から順に認識文字候補として出力
する。このとき照合用辞書7に登録された辞書パターン
との距離が小さいほど対応する文字信頼度が大きくなる
ように、ある一定値から距離を引いた値が文字信頼度と
して対応付けして出力される(S204)。したがっ
て、文字信頼度は、対応する認識文字候補が該文字であ
る確からしさを示す。
【0055】次に、文字列生成部4により認識候補文字
列が生成されて出力される(S205)。具体的には、
文字認識部3から出力された認識文字候補を組合せて、
すべてのストロークがいずれかの認識文字候補に1回だ
け含まれるような複数の認識候補文字列を生成して出力
するとともに、言換えると切出された文字候補領域に対
して文字認識部3で求めた認識文字候補から、文字候補
領域の重なりがないような文字候補領域の組合せからな
る複数の認識文字候補の文字列を認識候補文字列として
出力するとともに、各認識候補文字列に含まれる認識候
補文字の文字信頼度を合計し文字数で除して正規化した
後、距離が小さい順に順位を求める。生成された認識候
補文字列すべてについて文字列信頼度を求めて、該認識
候補文字列と対応付けて出力する。
【0056】具体的には、該認識候補文字列に含まれる
認識文字候補それぞれの文字認識部3により出力された
対応の文字信頼度の合計を該認識候補文字列に含まれる
文字数で割って、その結果を、文字列信頼度として出力
する。したがって、文字列信頼度は対応の認識候補文字
列についての該文字列であることの確からしさ、または
文字列認識精度といえる。このように文字列信頼度は対
応する文字列の文字数で正規化されているから、文字列
の文字数の多少に依存しない認識精度を得ることができ
る。
【0057】なお、ここでは、対応の文字信頼度の合計
を該認識候補文字列に含まれる文字数で除することで正
規化された文字列信頼度を得ているが、正規化の方法は
これに限定されない。
【0058】認識候補文字列が出力される際には、対応
の文字列信頼度の値が大きいものから順にソートされて
出力される。この出力はモニタ110による表示により
なされる。表2には、たとえば5個の認識候補文字列が
文字列信頼度の順に1位〜5位まで順位付けされて出力
された場合の例が示される。
【0059】
【表2】
【0060】上述した文字列信頼度を求める場合の除算
に用いられる文字数は、すべてのストロークがすべて1
回ずつ含まれる認識候補文字列における文字数に相当す
る。たとえば、生成された認識候補文字列が「ワイング
ラス1こ」の場合は8文字となり「ワイングラスに」の
場合は7文字になる。
【0061】また、認識候補文字列の生成において言語
処理辞書8の文字の遷移確率テーブルを用いて文字列信
頼度を算出することもできる。遷移確率テーブルには、
たとえば、文字列においてある文字と次位に位置する
(記載される)文字との組合せとなる確率が、この2文
字間の遷移確率として登録されている。遷移確率も用い
て文字列信頼度が算出される場合には、対応の文字信頼
度のみにより文字列信頼度が求められる場合に比較し
て、より精度の高い文字列信頼度、言換えると文字列認
識精度をより正確に算出できる。本実施例では遷移確率
を1〜128で示す。遷移確率テーブルを用いた認識候
補文字列についての文字遷移確率計算の例が表3に示さ
れる。
【0062】
【表3】
【0063】表3で示されるように、認識候補文字列そ
れそれについて各文字間の遷移確率の合計を遷移数(=
文字数−1)で割ることで正規化が行なわれた文字列遷
移確率が得られる。認識候補文字列それぞれについて、
このようにして求められた遷移確率と前述のようにして
文字信頼度から得た文字列信頼度(表2参照)との合計
値を最終的な文字列信頼度として用いる。その具体例が
表4に示されている。
【0064】
【表4】
【0065】なお、ここでは、各文字間の遷移確率の合
計を遷移数(=文字数−1)で割ることで正規化が行な
われた文字列遷移確率を得ているが、正規化の方法は、
これに限定されない。
【0066】また、認識候補文字列の生成において文字
形状の特徴量を用いて文字列信頼度を算出することもで
きる。文字形状特徴量は、切出された文字候補領域の文
字の形状に基づく評価値である。以下、この評価値を形
状信頼度という。図5は、本実施の形態1による形状信
頼度算出のためのパラメータを示す図である。
【0067】本実施の形態では文字に対応して矩形の文
字候補領域が切出されるので、形状信頼度算出のため
に、文字候補領域に対応の矩形の横幅を示すパラメータ
dxおよび縦幅を示すパラメータdy、ならびに該矩形
のパラメータDistLおよびパラメータDistRが用いられ
る。パラメータDistLは該矩形の左に隣接する矩形との
距離を示し、パラメータDistRは該矩形の右に隣接する
矩形との距離を示す。パラメータDistLおよびDistRそ
れぞれは、対応の隣接矩形がなければ極大値を示す。図
5では、文字列中の「ン」に対応の矩形を例にして各種パ
ラメータが示されている。
【0068】上述の各種パラメータを用いて切出された
文字領域候補の矩形それぞれについての形状信頼度は、
次の式(1)に従い求められる。
【0069】 形状信頼度=100−DL−DR−DS …(式1) 式1中のパラメータの計算式を次に示す。
【0070】IF dx>dy THEN Square=
(Ds*dx/dy)−Ds IF dy>dx THEN nSquare=Ds−(Ds*d
x/dy) IF dx=dy THEN nSquare=0 DS=Max(Square−Dss〔code〕,Dss〔code〕−Squar
e) ここで、パラメータDsは一定値であり、本実施の形態で
は40が適用されて、Dss〔code〕は対応する文字コー
ドの標準的な矩形度であり、予め求められた値が適用さ
れる。そして、次の条件にて式1中の各パラメータの値
が求まる。なお、本実施の形態では、Dn=5mm、Dt=
30およびDw=6としている。
【0071】IF DistL>Dn THEN DL=0 IF 0≦DistL≦Dn THEN DL=Dt−DistL*
Dw IF DistL<0 THEN DL=Dt IF DistR>Dn THEN DR=0 IF 0≦DistR≦Dn THEN DR=Dt−DistL*
Dw IF DistR<0 THEN DR=Dt 以上のように求められた各矩形の形状信頼度を用いて、
前述の文字信頼度から文字列信頼度を求めたのと同様に
計算して、文字列信頼度を求める。認識候補文字列それ
ぞれについての形状信頼度による文字列信頼度の具体例
が表5に示されている。
【0072】
【表5】
【0073】なお、ここでは、各文字の形状信頼度の合
計を文字の総数で割ることで正規化が行なわれた文字列
信頼度を得ているが、正規化の方法は、これに限定され
ない。
【0074】認識候補文字列それぞれについて、形状信
頼度による文字列信頼度と前述のように文字信頼度から
求まった文字列信頼度との合計値を最終的な文字列信頼
度とすることもできる。
【0075】また、文字信頼度、遷移確率および形状信
頼度それぞれによる文字列信頼度の和から最終的な文字
列信頼度を求めるようにしてもよい。
【0076】このように、文字信頼度のみならず、遷移
確率または形状信頼度が考慮されて文字列信頼度が取得
される場合には、より正確な文字列信頼度、ひいては文
字列認識精度を取得できる。
【0077】次に、文字列順位判定部5により文字列順
位判定と文字列順位入換えの処理が行なわれる(S20
6とS207のループ処理)。具体的には、文字列生成
部4から出力される第1位の認識候補文字列と第2位か
ら第5位までの認識候補文字列それぞれとを順に比較
し、第2位〜第5位の認識候補文字列それぞれにおいて
第1位の認識候補文字列と異なる部分の文字列を検出す
る。検出された部分文字列のみで相互に文字列信頼度の
比較を行なう。その結果、第1位の認識候補文字列の対
応の部分文字列の文字列信頼度よりも高い文字列信頼度
の部分文字列を含む認識候補文字列が、第2位〜第5位
の認識候補文字列に存在すれば、順位逆転有りと判定さ
れて(S206でYES)、該認識候補文字列と第1位
の認識候補文字列との順位は入換えられる(S20
7)。
【0078】さらに、同様の処理が、第2位の認識候補
文字列と第3位〜第5位の認識候補文字列とで、続いて
第3位の認識候補文字列と第4位〜第5位の認識候補文
字列とで順に繰返される。このようにして、すべての順
位間の認識候補文字列の比較処理が行なわれて、上位の
認識候補文字列より信頼度が高い下位の認識候補文字列
が存在すれば、認識候補文字列間で順位が入換えられ
る。
【0079】このような順位の入換えを、表2の例で説
明する。まず第1位と第2位の認識候補文字列を比較し
「1こ」および「に」は、異なる部分文字列として検出
される。この部分文字列についての文字列信頼度の比較
が表6のように行なわれる。
【0080】
【表6】
【0081】表6を参照すると、対応する部分文字列の
文字列信頼度の値が第1位の認識候補文字列よりも第2
位の認識候補文字列の方が大きいことがわかる。この結
果、第1位を認識候補文字列の「新品ワイングラスに」
に、第2位を認識候補文字列の「新品ワイングラス1
こ」となるように、認識候補文字列の順位の入換えが行
なわれる。
【0082】続いて、表7に示されるようにして、順位
入換え結果の第1位の認識候補文字列と第3位の認識候
補文字列とについて比較される。
【0083】
【表7】
【0084】表7では、両認識候補文字列についての異
なる部分文字列それぞれの文字列信頼度が求められてい
る。ここでは、異なる部分文字列は、第1位の認識候補
文字列については「ス」および「に」であり、第3位の
認識候補文字列については「ヌ」および「1こ」であ
る。このような2つの部分文字列それぞれについて両認
識候補文字列間で文字列信頼度を独立に比較した結果、
相反する結果となった場合は、順位逆転の有無の判定が
困難となる。これを避けるために、両認識候補文字列間
で異なる部分文字列の文字列信頼度をまとめて比較して
一意の値を求める。これにより妥当な順位逆転有無の判
定を行なうことができる。
【0085】表7の場合は、第1位の認識候補文字列の
方が対応する部分文字列の文字列信頼度の値が第3位の
認識候補文字列のそれよりも大きいので、順位逆転は無
しと判定されて、両認識候補文字列間では順位の変更は
行なわれない。
【0086】文字列順位判定部5によりこのような再順
位付けがなされるから、より正確な順位付けが可能とな
る。
【0087】文字列順位判定部5による文字列順位入換
えの処理は、筆記者の指示が外部から与えられたときの
み実行されて、それ以外のときは実行されないようにし
てもよい。
【0088】また、文字列順位判定部5による文字列順
位入換えの処理が施される対象となる認識候補文字列
を、外部から与えられる筆記者の指示に基づいて決定さ
れるようにしてもよい。たとえば、第1位から第5位の
認識候補文字列が有った場合、筆記者はペンタブレット
170のペンでタップすることによりモニタ110に表
示された第2位〜第4位までの認識候補文字列を順位入
換え処理を行なう対象として指定し、予めタブレット上
に用意された再計算ボタンがタップされることで、文字
列順位判定部5は指定された第2位〜第4位までの認識
候補文字列について順位入換え処理を行なう。
【0089】なお、異なる部分文字列の文字列信頼度
は、前述のように対応する文字信頼度による文字列信頼
度と遷移確率による文字列信頼度の和、または対応する
文字信頼度による文字列信頼度と形状信頼度による文字
列信頼度との和、または対応する文字信頼度と遷移確率
と形状信頼度それぞれによる文字列信頼度の総和により
求めるようにしてもよい。
【0090】以上の処理の結果、表示部6により、表8
のように文字列信頼度で順位付けされた認識候補文字列
が、認識結果としてモニタ10に表示される(S21
1)。
【0091】
【表8】
【0092】このように提示される第1位の認識候補文
字列は正解である確率が高くなるので、表示を確認した
ユーザは、多くの場合、第1位の認識候補文字列を正解
文字列として指定入力できるから、手書き入力文字の修
正や再度、手書き文字を入力するという手間を省略でき
て、入力時間の短縮および操作性の向上が図れる。
【0093】以上の実施の形態における順位逆転の有無
の判定(S206)は、以下のように省略することもで
きる。つまり、文字列生成部4が出力する第1位の認識
候補文字列と第2位から最大順位までの認識候補文字列
それぞれとのみについて上述したような比較を行なうよ
うにすることで、処理を簡略化してもよい。
【0094】ここでは、ペンなどを操作して手書き入力
される文字をリアルタイムに認識するようにしていた
が、手書き文字入力方法としてイメージスキャナを用る
こともできる。その場合は、文字を座標列データで表現
するとサイズが大きくなるので2値画像のような画像デ
ータとして扱い、S203の文字切出し処理以降の処理
が同様に行なわれる。
【0095】なお、ここでは、文字列信頼度の高い順に
5つの認識候補文字列が表示されているが、最終的に表
示される認識候補文字列の数は、5個に限定されない。
例えば、文字列信頼度が最高の認識候補文字列のみが認
識結果として筆記者に提示されるようにしてもよいし、
筆記者が予め出力する認識候補文字列数を上位から何個
というように指定してもよい。
【0096】(実施の形態2)次に実施の形態2につい
て説明する。
【0097】以上説明した文字列認識処理機能を有した
システムは、プログラムで実現される。本実施の形態2
では、このプログラムは機械読取可能な記録媒体に格納
される。
【0098】本実施の形態では、この記録媒体として、
図2に示されているコンピュータで処理が行なわれるた
めに必要なメモリ、たとえばメモリ124のROMのよ
うなそのものがプログラムメディアであってもよいし、
また外部記憶装置として磁気テープ装置およびCD−R
OM駆動装置40などのプログラム読取装置が設けら
れ、そこに記録媒体である磁気テープまたはCD−RO
M142が挿入されることで読取可能なプログラムメデ
ィアであってもよい。いずれの場合においても、格納さ
れているプログラムはCPU122がアクセスして実行
させる構成であってもよいし、あるいはいずれの場合も
プログラムが一旦読出されて、読出されたプログラム
は、図2のコンピュータの所定のプログラム記憶エリ
ア、たとえばメモリ124のRAMのプログラム記憶エ
リアにロードされて、CPU122により読出されて実
行される方式であってもよい。このロード用のプログラ
ムは、予め当該コンピュータに格納されているものとす
る。
【0099】ここで、上述したプログラムメディアはコ
ンピュータ本体と分離可能に構成される記録媒体であ
り、磁気テープやカセットテープなどのテープ系、FD
132や固定ディスク126などの磁気ディスクやCD
−ROM140/MO(Magnetic Optical Disc)/
MD(Mini Disc)/DVD(Digital Versatile Di
sc)などの光ディスクのディスク系、ICカード(メモ
リカードを含む)/光カードなどのカード系、あるいは
マスクROM、EPROM(Erasable and Programma
ble ROM)、EEPROM(Electrically EPRO
M)、フラッシュROMなどによる半導体メモリを含め
た固定的にプログラムを担持する媒体であってもよい。
【0100】また、本実施の形態においては、コンピュ
ータはインターネットを含む通信ネットワーク182と
接続可能な構成が採用されているから、これら通信ネッ
トワーク182からプログラムがダウンロードされるよ
うな流動的にプログラムを担持する媒体であってもよ
い。なお、このように通信ネットワーク182からプロ
グラムがダウンロードされる場合には、ダウンロード用
プログラムは予め当該コンピュータ本体に格納しておく
か、あるいは別の記録媒体から予め当該コンピュータ本
体にインストールされるものであってもよい。
【0101】なお記録媒体に格納されている内容として
はプログラムに限定されず、データであってもよい。
【0102】今回開示された実施の形態はすべての点で
例示であって制限的なものではないと考えられるべきで
ある。本発明の範囲は上記した説明ではなくて特許請求
の範囲によって示され、特許請求の範囲と均等の意味お
よび範囲内でのすべての変更が含まれることが意図され
る。
【図面の簡単な説明】
【図1】 この発明の実施の形態1に係る手書き文字列
認識装置のブロック図である。
【図2】 図1の手書き文字列認識装置が搭載されるコ
ンピュータの構成図である。
【図3】 この発明の実施の形態1に係る手書き文字列
認識処理のフローチャートである。
【図4】 (A)〜(D)は、図1の文字切出し部2の
手順を説明する図である。
【図5】 本実施の形態1による形状信頼度算出のため
のパラメータを示す図である。
【符号の説明】
1 ストローク入力部、2 文字切出し部、3 文字認
識部、4 文字列生成部、5 文字列順位判定部、6
表示部、7 照合用辞書、8 言語処理辞書。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 杉山 晃一 大阪府大阪市阿倍野区長池町22番22号 シ ャープ株式会社内 (72)発明者 鈴木 哲 大阪府大阪市阿倍野区長池町22番22号 シ ャープ株式会社内 Fターム(参考) 5B064 AB04 BA05 DD06 EA00 EA36

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 文字列によるパターンデータを入力して
    1文字領域ごとにパターン認識し、認識結果文字とそれ
    である確からしさを示す文字信頼度とを検出する文字認
    識手段と、 前記文字認識手段により前記1文字領域に対応して検出
    された前記認識結果文字を、前記文字列の全ストローク
    それぞれがいずれかの前記1文字領域に1回だけ含まれ
    るように組合せて複数の認識候補文字列を生成する文字
    列生成手段と、 前記文字列生成手段により生成された前記複数の認識候
    補文字列それぞれについて、それである確からしさを示
    す文字列信頼度を得て、前記複数の認識候補文字列を前
    記文字列信頼度に従い順位付けして出力する順位付け手
    段と、 前記順位付け手段により特定順位に付けられた前記認識
    候補文字列と前記特定順位以外に付けられた前記認識候
    補文字列とを、両者において相違する部分文字列につい
    て得られる前記文字列信頼度に従い再度、順位付けして
    出力する再順位付け手段とを備えて、 前記文字列信頼度は、対応の文字列に含まれる前記認識
    結果文字の前記文字信頼度に基づいて正規化された値を
    含むことを特徴とする、文字列認識装置。
  2. 【請求項2】 前記再順位付け手段は、 前記順位付け手段により第1位に付けられた前記認識候
    補文字列と第1位以降に付けられた前記認識候補文字列
    とを、両者において相違する部分文字列について得られ
    る前記文字列信頼度に従い再度、順位付けすることを特
    徴とする、請求項1に記載の文字列認識装置。
  3. 【請求項3】 前記再順位付け手段は、 前記順位付け手段により各順位に付けられた前記認識文
    字列候補と該順位以降に付けられた前記認識文字列候補
    とを、両者において相違する部分文字列について得られ
    る前記文字列信頼度に従い再度、順位付けすることを特
    徴とする、請求項1に記載の文字列認識装置。
  4. 【請求項4】 前記パターンデータは、前記文字列が手
    書き入力されて得られる筆跡の座標データであることを
    特徴とする、請求項1ないし3のいずれかに記載の文字
    列認識装置。
  5. 【請求項5】 前記文字列信頼度はさらに、 対応の文字列に含まれる前記1文字領域ごとの文字の形
    状特徴に基づく評価値に基づいて正規化された値を含む
    ことを特徴とする、請求項1ないし4のいずれかに記載
    の文字列認識装置。
  6. 【請求項6】 前記文字列信頼度はさらに、 対応の文字列に含まれる文字と次位に位置する文字との
    組合せとなる確率値に基づいて正規化された値を含むこ
    とを特徴とする、請求項1ないし5のいずれかに記載の
    文字列認識装置。
  7. 【請求項7】 再順位付け手段は、外部から与えられる
    指示入力に応答して、再度順位付けすることを特徴とす
    る、請求項1ないし6のいずれかに記載の文字列認識装
    置。
  8. 【請求項8】 前記特定順位に付けられた前記認識候補
    文字列と前記特定順位以外に付けられた前記認識候補文
    字列とは、外部からの入力により指定されることを特徴
    とする、請求項1ないし7のいずれかに記載の文字列認
    識装置。
JP2001209362A 2001-07-10 2001-07-10 文字列認識装置 Pending JP2003022417A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001209362A JP2003022417A (ja) 2001-07-10 2001-07-10 文字列認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001209362A JP2003022417A (ja) 2001-07-10 2001-07-10 文字列認識装置

Publications (1)

Publication Number Publication Date
JP2003022417A true JP2003022417A (ja) 2003-01-24

Family

ID=19045026

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001209362A Pending JP2003022417A (ja) 2001-07-10 2001-07-10 文字列認識装置

Country Status (1)

Country Link
JP (1) JP2003022417A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100388457C (zh) * 2005-12-08 2008-05-14 北京圆合电子技术有限责任公司 真空机械手
JP2008546058A (ja) * 2005-05-18 2008-12-18 スキャンアール,インク. ビジネスデータの取得処理装置および取得処理方法
WO2010150916A1 (en) * 2009-06-24 2010-12-29 Sharp Kabushiki Kaisha Handwriting recognition method and device

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008546058A (ja) * 2005-05-18 2008-12-18 スキャンアール,インク. ビジネスデータの取得処理装置および取得処理方法
CN100388457C (zh) * 2005-12-08 2008-05-14 北京圆合电子技术有限责任公司 真空机械手
WO2010150916A1 (en) * 2009-06-24 2010-12-29 Sharp Kabushiki Kaisha Handwriting recognition method and device
CN101930545A (zh) * 2009-06-24 2010-12-29 夏普株式会社 手写识别方法和设备
JP2012520492A (ja) * 2009-06-24 2012-09-06 シャープ株式会社 手書き文字認識方法および手書き文字認識装置

Similar Documents

Publication Publication Date Title
CN107656922B (zh) 一种翻译方法、装置、终端及存储介质
US7792369B2 (en) Form processing method, form processing device, and computer product
US5454046A (en) Universal symbolic handwriting recognition system
US10007859B2 (en) System and method for superimposed handwriting recognition technology
US10963717B1 (en) Auto-correction of pattern defined strings
US8515175B2 (en) Storage medium, apparatus and method for recognizing characters in a document image using document recognition
CN104102338A (zh) 编辑装置和编辑方法
CN113420546A (zh) 文本纠错方法、装置、电子设备及可读存储介质
JP2007188512A (ja) 文字認識方法、文字認識プログラム及び文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体
US20100215276A1 (en) Storage medium storing character recognition program, character recognition method, and character recognition apparatus
US6035062A (en) Character recognition method and apparatus
US7756872B2 (en) Searching device and program product
JP3958003B2 (ja) 文字認識方法、文字認識プログラム、文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体及び文字認識装置
JP2003022417A (ja) 文字列認識装置
CN112560849B (zh) 基于神经网络算法的文理分割方法及系统
US6320985B1 (en) Apparatus and method for augmenting data in handwriting recognition system
JP4466241B2 (ja) 文書処理手法及び文書処理装置
JP6007720B2 (ja) 情報処理装置及び情報処理プログラム
JP5888222B2 (ja) 情報処理装置及び情報処理プログラム
JP2003331214A (ja) 文字認識誤り訂正方法、装置及びプログラム
JP7404625B2 (ja) 情報処理装置、及びプログラム
JPH11184976A (ja) 辞書学習方式および文字認識装置
JPH09274645A (ja) 文字認識方法および装置
JP2007172639A (ja) 文字認識方法、文字認識プログラム及び文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2007172640A (ja) 文字認識方法、文字認識プログラム及び文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040611

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061121

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070119

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070220