JP2004078366A - 文字認識装置、文字認識方法、およびその方法をコンピュータに実行させるプログラム - Google Patents

文字認識装置、文字認識方法、およびその方法をコンピュータに実行させるプログラム Download PDF

Info

Publication number
JP2004078366A
JP2004078366A JP2002235158A JP2002235158A JP2004078366A JP 2004078366 A JP2004078366 A JP 2004078366A JP 2002235158 A JP2002235158 A JP 2002235158A JP 2002235158 A JP2002235158 A JP 2002235158A JP 2004078366 A JP2004078366 A JP 2004078366A
Authority
JP
Japan
Prior art keywords
character
character recognition
deformation
certainty
handwritten
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002235158A
Other languages
English (en)
Inventor
Nobuyuki Doi
土井 信幸
Sadao Takahashi
高橋 禎郎
Hirofumi Horikawa
堀川 裕文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2002235158A priority Critical patent/JP2004078366A/ja
Publication of JP2004078366A publication Critical patent/JP2004078366A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

【課題】加筆情報に基づいて手書き文字の認識を行う高精度の文字認識装置、文字認識方法、およびその方法をコンピュータに実行させるプログラムを提供すること。
【解決手段】入力された手書き文字に基づき文字認識する文字認識部103と、前記手書き文字の特徴点と前記文字認識部によって認識された文字の特徴点との一致度を示す確信度を求め、前記確信度と所定基準値とを比較する確信度判定部104と、前記確信度判定部によって前記確信度が所定基準値より低いと判定された場合、前記手書き文字に変形処理を施し、再び前記文字認識部に入力する座標情報変更部105と、を備えたことを特徴とする文字認識装置である。
【選択図】   図1

Description

【0001】
【発明の属する技術分野】
この発明は、手書き文字に基づいて文字認識する文字認識装置、文字認識方法、およびその方法をコンピュータに実行させるプログラムに関する。
【0002】
【従来の技術】
近年、手書き文字を認識する文字認識装置が各種考案されてきた。手書き文字の認識が困難な点は、筆跡に個人差があり、さらに英字、数字、漢字、ひらがな、およびカタカナなどの文字種の違いがあって、微妙な文字の大きさの違いや、文字の線の太さの違いなどが機械による認識に影響を与えることである。それらは人間の目では容易に判別できたとしても、装置が判別しながら読み取るのは容易ではない。
【0003】
図28は、従来の文字認識装置の構成を示すブロック図である。加筆箇所のそれぞれの座標情報(x,y)を取得する座標情報取得装置2800は、作業者の加筆時に加筆箇所の座標情報を取得する。従来の文字認識装置2810は、通信部2801、加筆切り出し部2802、文字認識部2803、および蓄積部2806を備える。
通信部2801は、座標情報取得装置2800からそれぞれの座標情報(x,y)を受信する。加筆切り出し部2802は、加筆情報として取り出す座標情報(x,y)を切り出す。次に切り出された座標情報により、ビットマップ(BMP)形式のような2次元の画像情報を構成する。そして、文字認識部2803は文字を認識する。蓄積部2806は、文字の認識結果を蓄積する。
【0004】
図29は、従来の文字認識装置の処理手順を示すフローチャートである。
ステップS2901において、通信部2801は手書き情報として座標情報を受信する。ステップS2902において、加筆切り出し部2802は、文字判定に必要な箇所を座標として切り出し、ビットマップ(BMP)形式などの画像ファイルにする。ステップS2903において、文字認識部2803は、加筆切り出し部2802より画像ファイルを得て、文字認識を行う。ステップS2906において、全ての箇所の文字認識を終了したかどうかを判定する。全ての文字認識が終了していない場合は、ステップS2902に戻り、残りに対して同様の処理を繰り返す。終了した場合は、判定結果を蓄積部2806に蓄積する。
この従来例の文字認識装置では、手書き文字の大小や線の太い細いによる補正動作は備えられていなかったため、読み取り精度は十分ではなかった。
【0005】
又、手書き文字入力パッドなどを利用する場合、手書きの順序(筆順)が問題となり、そのデータは時系列座標情報となり、時系列座標情報読み取り方式が考えられていた。
図30は、一般的な手書き入力文字パッドによる手書き入力を示す模式的斜視図である。板状部3001は筆圧感知機能を有する。板状部3001の上に紙3003などを置いて、ペン3002によって加筆を行う。ペン3002には、加筆用にボールペンと同等の機能を持つペン先を有する。ペン3002により加筆作業を行うと、板状部3001がペン先の圧力により加筆を検知する。板状部3001は、圧力が加わる板状部3001上でのそれぞれの座標(x,y)を取得する。同時に、筆順を時系列的に認識するために、圧力が加わった時刻を取得する。板状部3001は、外部通信装置(不図示)を有する。これにより、取得した座標を外部の装置に送信する。
【0006】
時系列座標読み取り方式の構成は、図28における座標情報取得装置2800が、人間の加筆時のそれぞれの時系列座標情報(x,y)を取得する装置となる。すなわち、作業者の加筆時に、加筆箇所の時系列座標情報を取得する。加筆切り出し部2802は、加筆情報として取り出す時系列座標情報(x,y)を切り出す。
【0007】
図31は、従来の文字認識装置における時系列座標読取方式の処理手順を示すフローチャートである。ステップS3101において、通信部2801は手書き情報として時系列座標情報を受信する。ステップS3102において、加筆切り出し部2802は、文字判定に必要な時系列座標情報を切り出す。ステップS3103において、文字認識部2803は、加筆切り出し部2802より時系列座標情報を得て、文字認識を行う。ステップS3106において、全ての箇所の文字認識を終了したかどうかを判定する。全ての文字認識が終了していない場合は、ステップS3102に戻り、残りに対して同様の処理を繰り返す。終了した場合は、判定結果を蓄積部2806に蓄積する。しかしながら、時系列座標読み取り方式を採用したとしても、人手による入力において、必ずしも正しい筆順で加筆されるとは限らず、そのため、精度の高い文字読み取りは困難であった。
【0008】
そこで、幾つかの文字認識精度を向上させる発明がなされてきた。例えば特開平7−160809号公報の発明「OCR装置」は、入力された手書き文字の文字認識範囲を矩形で規定し、その端部(矩形の各辺)に手書き文字が接触しているか否かを検出して、文字認識結果の確信度が所定基準値より低いときには、接触しているか否かの検出結果に応じて文字認識範囲を変更する方式を開示している。こうして同号公報の発明は、文字認識位置からはみだした文字についての認識率を向上させるとしている。
【0009】
しかしながら同号公報の発明は、文字種や線の太さ、大きさの違いによる文字認識については、考慮していなく、文字が小さいあるいは文字の線が細いもしくは太いことによる文字認識の誤りには効果がない。また、同発明は、適用する画像入力装置はFAX等を想定し、帳票などの所定の書式上に書かれた文字がはみ出た場合に、その読み取り範囲を変えることによって再認識して、文字認識率を向上させることを目的としている。そのような方式は、帳票などの書式が定まった入力情報には有効であったとしても、一般的な入力、例えば画像入力装置に手書き文字パッドなどを使用する場合など文字を書き込む書式が一般的に定まっていない場合には有効とはいえず、認識精度が低下してしまう。
【0010】
【発明が解決しようとする課題】
以上のように従来の文字認識方式では、文字の大きさが小さい、または、文字の線の太さが細い為・太い為、もしくは、作業者の筆順が間違っているなどの原因により、手書きされた文字認識の認識精度が低かった。また、従来方式では、文字の大きさと線の太さのバランスが悪いと認識が悪くなっていた。例えば、線が細すぎる場合には、文字が二つに分かれて認識されることがあったり、反対に線が太すぎる場合には、文字がつぶれて異なる文字に認識されることがあったりして、認識精度が十分ではなかった。
【0011】
この発明は上記に鑑みてなされたもので、入力される手書き文字の大きさや線の太さが均一でなかったとしても、高い精度で文字認識ができる文字認識装置、文字認識方法、およびその方法をコンピュータに実行させるプログラムを得ることを目的としている。
【0012】
【課題を解決するための手段】
上記目的を達成するため、請求項1にかかる発明は、入力された手書き文字を文字認識する認識手段と、前記手書き文字の特徴点と前記認識手段によって認識された文字の特徴点との一致度を示す確信度を求め、前記確信度と所定基準値とを比較する判定手段と、前記判定手段によって前記確信度が所定基準値より低いと判定された場合、前記手書き文字に変形処理を施し、再び前記認識手段に入力する変形手段と、を備えたことを特徴とする文字認識装置である。
【0013】
この請求項1の発明によれば、手書き文字に基づく文字認識の確信度が低い場合、変形手段は読み取った手書き文字に変形処理を施して、再度認識手段に入力して認識動作を行うので、文字の特徴点の一致度が低い場合は、より特徴点が表れやすいように変形して再び文字認識を行うため、精度の高い文字認識が可能となる。
【0014】
また、請求項2にかかる発明は、請求項1に記載の文字認識装置において、前記変形手段は、前記手書き文字の大きさを変えることを特徴とする。
【0015】
この請求項2の発明によれば、手書き文字に基づく文字認識の確信度が低い場合は、より特徴点が出やすいように、変形手段が読み取った手書き文字の大きさを変更してより特徴点を一致させやすいようにして再度認識手段に入力して文字認識を行うため、精度の高い文字認識ができる。
【0016】
また、請求項3にかかる発明は、請求項2に記載の文字認識装置において、前記変形手段は、前記確信度に応じた変形倍率で前記手書き文字の大きさを変えることを特徴とする。
【0017】
この請求項3の発明によれば、手書き文字の文字認識の確信度に応じて、大きさの変形倍率を決定して再度文字認識を行うので、特徴点が低い場合はより大きな変形を行って再び文字認識動作を行うことができるので、能率的で精度の高い文字認識ができる。
【0018】
また、請求項4にかかる発明は、請求項1または2に記載の文字認識装置において、前記変形手段は、前記手書き文字の線の太さを変えることを特徴とする。
【0019】
この請求項4の発明によれば、手書き文字の文字認識の確信度が低い場合は、変形手段は読み取った手書き文字の太さを変更して文字の特徴点が一致し易いように変形して再度認識させるので、精度の高い文字認識ができる。
【0020】
また、請求項5にかかる発明は、請求項4に記載の文字認識装置において、前記変形手段は、前記確信度に応じた変形倍率で前記手書き文字の線の太さを変えることを特徴とする。
【0021】
この請求項5の発明によれば、手書き文字の文字認識において、確信度に応じて文字の線の太さ変化の割合を決定して再度認識手段に入力するので、文字の特徴点の一致度が低い場合は、より早く線の太さを変化させて一致度を高めて再度認識させるので、能率的で精度の高い文字認識ができる。
【0022】
また、請求項6にかかる発明は、請求項2または3に記載の文字認識装置において、前記認識手段が文字認識を複数回行って、前記判定手段が確信度の低下を検出した場合、前記変形手段は手書き文字の変形倍率の大きさの変化方向を変えることを特徴とする。
【0023】
この請求項6の発明によれば、手書き文字の認識において文字の大きさを変更しながら複数回文字認識を行って確信度が低下する場合、大きさ変更の方向を変えてより確信度の高まる方向で認識するので、文字の特徴点がよりはっきりと認識できるので、精度の高い文字認識ができる。
【0024】
また、請求項7にかかる発明は、請求項4または5に記載の文字認識装置において、前記認識手段が文字認識を複数回行って、前記判定手段が確信度の低下を検出した場合、前記変形手段は手書き文字の線の太さの変化方向を変えることを特徴とする。
【0025】
この請求項7の発明によれば、手書き文字の認識において文字の太さを変更しながら複数回文字認識を行って確信度が低下する場合、文字の太さの変更の方向をより確信度の高まる方向に変化させて認識するので、文字の特徴点がよりはっきりと認識でき、精度の高い文字認識ができる。
【0026】
また、請求項8にかかる発明は、請求項1に記載の文字認識装置において、文字種毎に設定された確信度に応じた変形パターン情報を格納する記憶手段を更に有し、前記変形手段は、前記変形パターン情報に基づいて前記手書き文字に対して文字種ごとに変形処理を施すことを特徴とする。
【0027】
この請求項8の発明によれば、手書きされる文字種、たとえばアルファベット、数字、漢字、およびひらがななど毎に設定された変形パターン情報を記憶手段に格納して文字種ごとに手書き文字を変形パターンに基づいて変形して認識するので、文字種ごとに文字の特徴点がより多く一致するように認識動作を行うので、より精度の高い文字認識ができる。
【0028】
また、請求項9にかかる発明は、請求項8に記載の文字認識装置において、前記変形パターン情報は、確信度に応じた文字の大きさの変倍情報を含むことを特徴とする。
【0029】
この請求項9の発明によれば、手書きされる文字種、たとえばアルファベット、数字、漢字、およびひらがななど毎に設定された文字の大きさを変化させるパターン情報を格納し、それに基づいて文字種ごとに大きさを変化させるので、文字種ごとに一致度を高めて認識させることができるので、より精度の高い文字認識ができる。
【0030】
また、請求項10にかかる発明は、請求項8または9に記載の文字認識装置において、前記変形パターン情報は、確信度に応じた手書き文字の線の太さの変倍情報であることを特徴とする。
【0031】
この請求項10の発明によれば、手書きされる文字種、たとえばアルファベット、数字、漢字、およびひらがななど毎に設定された文字線の太さを変化させるパターン情報を格納し、それに基づいて文字種ごとに太さを変化させるので、文字種ごとに一致度を高めて認識させることができるので、より精度の高い文字認識ができる。
【0032】
また、請求項11にかかる発明は、請求項9または10に記載の文字認識装置において、前記変形パターン情報は、異なる変形倍率方向の複数の前記変倍情報を含み、前記変形手段は、前記認識手段による複数回の文字認識の結果、前記判定手段によって前記確信度の低下が検出された場合、既に選択されている前記変倍情報を他の前記変倍情報に切り替えることを特徴とする。
【0033】
この請求項11の発明によれば、文字の変倍情報を用いて文字を変形させて認識させることによって返って確信度が低下する場合は、複数の変倍情報の中から他の変倍情報に切り替えて認識させ、より確信度の高まる方向に変形させて認識させるので、精度の高い文字認識ができる。
【0034】
また、請求項12にかかる発明は、入力される手書き文字に基づいて文字認識する第1の認識工程と、前記入力される手書き文字の特徴点と前記認識手段によって認識された文字の特徴点との一致度を示す確信度を求め、前記確信度と所定基準値とを比較する判定工程と、前記判定工程において、前記確信度が所定基準値より低いと判定された場合、前記手書き文字に変形処理を施す変形工程と、その変形処理を施された文字を再び入力して文字認識を行う第2の認識工程と、を含むことを特徴とする文字認識方法である。
【0035】
この請求項12の発明によれば、入力された手書き文字に基づいて文字認識して、その文字の特徴点と認識された文字の特徴点との一致度が低い場合は、その手書き文字を変形して再度文字認識を行うので、手書き文字認識方法において、精度の高い文字認識が可能である。
【0036】
また、請求項13にかかる発明は、請求項12に記載の文字認識方法において、前記手書き文字の変形工程は、前記手書き文字の大きさを変形することを特徴とする。
【0037】
この請求項13の発明によれば、手書き文字に基づく文字認識の確信度が低い場合は、その文字の大きさを変更して再度文字認識を行う認識工程を含むので、文字認識方法において、精度の高い文字認識が可能である。
【0038】
また、請求項14にかかる発明は、請求項12または13に記載の文字認識方法において、前記手書き文字の変形工程は、前記手書き文字の線の太さを変形することを特徴とする。
【0039】
この請求項14の発明によれば、手書き文字に基づく文字認識における確信度が低い場合は、その文字の線の太さを変更して再度文字認識を行うので、精度の高い文字認識が可能である。
【0040】
また、請求項15にかかる発明は、請求項12〜14のいずれか一つに記載された方法をコンピュータに実行させるプログラムであるので、請求項12〜14のいずれか1つに記載された方法の動作をコンピュータによって実行することができる。
【0041】
また、本発明の他の態様としては、請求項1〜請求項11のいずれか1項に記載の文字認識装置において、前記変形手段による変形によって文字の線が細くなったためにつながって書かれた文字が離れてしまった場合、その文字の部分を再びつなげて、再び前記認識手段に入力する結合補正手段を、更に備えることを特徴とする文字認識装置である。文字の線の結合補正手段は、文字の線の太さを細く変更して認識する場合、線同士の結合部分が離れてしまうことがあるが、その際に、離れた線を再結合させる補正を施して、再び認識手段にその文字を認識させるので、手書き文字の読み取り精度を向上させることができる。
【0042】
また、本発明の他の態様としては、請求項1〜請求項11のいずれか1項に記載の文字認識装置において、前記変形手段による変形によって文字の線が太くなったために、離れて書かれていた文字がつながってしまった場合、その文字のつながった部分を離間させて、再び前記認識手段に入力する離間補正手段を、更に備えることを特徴とする文字認識装置である。文字の線の離間補正手段は、文字の線の太さが太く変更されることにより、もともと離れていた部分が太くなったことによって結合してしまった場合、その結合部分を再び離す離間補正を行い、再び文字認識させるので、手書き文字認識の精度を向上させることができる。
【0043】
また、本発明の他の態様としては、請求項1〜請求項11のいずれか1項に記載の文字認識装置において、前記変形手段による変形によって文字の線が太くなったために文字の空白部分がつながって消失してしまった場合、その空白の消失部分に再び空白部分を復活させて、再び前記認識手段に入力するつぶれ補正手段を、更に備えたことを特徴とする文字認識装置である。つぶれ補正手段は、文字の線の太さが太く変更されたことによって、空白部分が黒で覆われてしまってつぶれた場合に、その黒つぶれを修正して空白部分を復活させるつぶれ補正を施し、再び文字認識させるので、手書き文字の読み取り精度を向上させることができる。
【0044】
【発明の実施の形態】
以下に添付図面を参照して、この発明にかかる文字認識装置、文字認識方法、およびその方法をコンピュータに実行させるプログラムの好適な実施の形態を詳細に説明する。
【0045】
(実施の形態1)
(文字認識装置の機能構成)
図1は、この発明の実施の形態1である文字認識装置の機能構成を示すブロック図である。図1に示されるように文字認識装置10は、通信部101、加筆切り出し部102、文字認識部103、確信度判定部104、座標情報変更部105、および蓄積部106から構成される。座標情報取得装置100は、文字認識装置10に対して、加筆箇所のそれぞれの座標情報(x,y)を入力する。座標情報取得装置100は、例えばダイヤルパッドのようなペン入力装置の場合、作業者の加筆時に加筆した文字のそれぞれの座標情報(x,y)が入力されていく。座標情報取得装置100は、また、ペン入力装置に限らず、ファックスやスキャナのような手書き情報を読み取る装置であっても良い。
【0046】
文字認識装置10には、画像データとして入力された文字から該当する文字を切り出す加筆切り出しプログラム、切り出された文字を認識する文字認識プログラム、入力される文字の特徴点と認識後の文字の特徴点とを計算し精度の目安である確信度を判定する確信度判定プログラム、入力された手書き文字の座標情報を変更する座標情報変更プログラム、および得られた認識データを蓄積し全体的な処理の進行を制御する制御プログラムなどのプログラムリソースがインストールされている。
【0047】
ここで、上述の加筆切り出し部102、文字認識部103、確信度判定部104、および座標情報変更部105は、上記の加筆切り出しプログラム、文字認識プログラム、確信度判定プログラム、座標情報変更プログラム、および全体的な処理の進行を制御する制御プログラムによって、それら機能が実行される。また、文字認識装置10は、プログラムや各種データを格納すべき各種のメモリを含む記憶部150を有する。
【0048】
通信部101は、座標情報取得装置100から文字の形状を構成する座標情報(x,y)を受信し、受信された座標情報は、記憶部150の座標情報ファイル151に保存される。このとき、通信部101は座標情報取得装置100から直接的に受信しても良く、あるいはインタネットやLANなどのネットワーク(不図示)を介して受信してもよい。
【0049】
加筆切り出し部102は、加筆情報として読み込む座標情報(x,y)を切り出す。そして、ビットマップ(BMP)形式のような2次元の画像情報を生成して、記憶部150の切出しデータファイル152に記憶する。文字認識部103は、切り出された座標情報から文字認識処理を行い、認識された文字の文字コードデータからなる文字変換ファイル153を記憶部150に格納する。ここで、加筆切出し部102、および文字認識部103は本発明における認識手段を構成する。
【0050】
確信度判定部104は、入力された文字の特徴点と文字認識結果の文字の特徴点との一致度を示す確信度を算出する。ここで確信度は、認識対象の文字と認識結果の文字との特徴点がどの程度一致しているかを示す比率であり、例えば文字の特徴量と辞書パターンの特徴量との距離(ユークリッド距離、マハラノビス距離など)を評価値として採用する。従って、文字認識の結果、類似度が大きい(距離が小さい)文字ほど確信度が高い値となる。具体的には、例えば、特開平4−47486号公報「文字認識方法」で説明される手段等によって算出される。そして、得られた確信度のデータは、確信度ファイル154として記憶部150に格納される。ここで、確信度判定部(以下、単に判定部と称する)104は本発明における判定手段を構成する。
【0051】
座標情報変更部105は、最初、切り出された箇所の座標情報を加筆切り出し部102から得る。そして、判定部104が求めた認識の確信度が所定基準値、例えば70%より低いと判定した場合は、判定部104はその判定を座標情報変更部105に伝達し、その結果、座標情報変更部105は座標の変更、例えば座標点の間隔の変更、もしくは座標点全体の位置移動、またはそれらの両方を行う。変更を施されたデータは、座標変更ファイル155として記憶部150に格納される。座標情報変更部105は、その変更された座標情報を加筆切り出し部102へと入力する。ここで、座標情報変更部105は本発明における変形手段を構成する。
【0052】
加筆切出し部102はその新しいデータを追記する形で、あるいは更新する形で、切出しデータファイル152の書き換えを行う。そしてその新しいデータ、すなわち新たに入力された座標情報を再び文字認識部103へと送る。
【0053】
蓄積部106は、文字の認識結果をその都度ごとに、あるいは最終的な文字認識の結果として、記憶部150の認識済みファイル156に格納する。
【0054】
文字認識装置10のハードウェア構成は、記憶部150とCPU(不図示)とを含み、記憶部150は、ROM、RAM、および必要に応じて他の外部メモリ、たとえばカード型メモリなどからなる。ROMは、OSや各種制御プログラムおよび各種データを格納し、RAMはCPUのワークエリアとして使用されまた各種データを格納し、そしてカード型メモリは各種データや認識結果のデータファイルなどを格納し、かつ一部はワークエリアとしても使用可能である。カード型メモリはハードディスクや他のコンパクトなメモリ、あるいは他の外部記憶装置であっても良い。
【0055】
(文字認識の処理の流れ)
図2は、本発明の実施の形態1の文字認識装置による手書き文字認識の流れを示すフローチャートである。ステップS201において、通信部101は手書き情報として座標情報を入力装置100から受信する。続いて、ステップS202において、加筆切り出し部102は文字判定に必要な箇所を座標として切り出し、BMP形式などの画像データにして切出しデータファイル152として記憶部150に格納する。
【0056】
続いて、文字認識部103は、加筆切り出し部102から画像ファイルを受信し、切り出し箇所の文字認識を行い、文字コードに変換した文字データを文字変換ファイル153として記憶部150に格納する(ステップS203)。
【0057】
続いて、確信度判定部104は、上述の確信度を算出し、所定の基準値、たとえば70%と比較する(ステップS204)。そして、算出された確信度が設定基準値以下である場合は(ステップS204のNo)、ステップS205に移る。その時の確信度などのデータは、記憶部150に確信度ファイル154として格納される。ここで基準値の設定は任意に設定可能としても良く、最初から設定されていても良く、あるいは文字種ごとに設定されていることが望ましい。
【0058】
座標情報変更部105は、変形処理の一例として、指定箇所の座標情報のスケール(座標スケール)を拡大縮小する、もしくは座標点すべてを移動する、あるいはその両方を行う(ステップS205)。それによりそれぞれ文字の拡大縮小、移動あるいはその両方が行われる。そして、再び切り出しステップに戻り(ステップS202)、切り出しデータファイルに追記されて同ファイルは更新され、再び前述の認識処理(ステップS203)を施される。
【0059】
確信度が所定基準値以上と判断された場合(ステップS204のYes)、全ての箇所の文字認識を終了したかを判定する(ステップS206)。全ての箇所の文字認識が終了していない場合は、ステップS203に戻り、残りの箇所に対して同様の文字認識処理を繰り返す。終了した場合は、蓄積部106は、認識済みファイル156を記憶部150に格納する。この場合、そのファイルには判定結果情報を添えることが望ましい。
【0060】
(文字の大きさ変更処理と文字の線の太さ変更処理)
図3は、本発明の実施の形態1による文字認識装置の手書き文字認識における、文字の大きさ変更と文字の線の太さの変更手順を示すフローチャートである。ステップS301〜ステップS304までは、前述のステップS201〜S204までと同様である。ここでは、座標スケールの変更・座標の移動(ステップS305a)、および線の太さの変更(ステップS305b)の処理をこの順番で施す。読み取った座標スケールの変更・座標の移動、あるいは太さの変更によって、それらが占める2次元上の点が変更され、認識された文字が拡大縮小・移動、あるいは太さを変更される。それらの変更は2次元的数値処理の常法によって実施可能である。なお、ここでは、座標スケールの変更・座標の移動を行った後に、線の太さの変更を行っているが、この順序が逆の場合も可能である。
【0061】
図4は、本発明の実施の形態1による文字認識装置において、手書き文字の座標点を広げる処理を施した説明図である。即ち、座標点を広げることによって文字の大きさは拡大される。この時、拡大にともなって通常、文字の太さもまた拡大される。その反対に座標点を縮小することによって文字の大きさは縮小される。
【0062】
図5は、手書き文字の座標点を広げたことによって文字が拡大されるが、しかし、同時に文字線の太さが抑制処理される場合の1例を示す説明図である。図4のように点の間隔を広げるように点の座標を変更すると2点(x1、y1)および(x2、y2)はそれぞれ(x1’、y1’)および(x2’、y2’)に変化するが、図5に示すように、この時、線の太さの変更ステップ(ステップS305b)において、同時に線の太さを抑制する。これらの点の間隔を広げる座標変更も、同時に線の太さが太くなることを抑制することも、2次元の数値処理の常法によって行う。その処理によって、文字は拡大されるとともに、太さの拡大は抑制されるので、より正確な読み取りが可能になる。
【0063】
図6は、本発明の実施の形態1による文字認識装置によって手書き文字の線を細くする説明図である。ここで2点(x1、y1)および(x2、y2)を両端に有する2次元の棒状の図形(図6のa)は、その幅が細く処理されている(図6のb)。
【0064】
図7は、本発明の実施の形態1による文字認識装置によって手書き文字が細くされた説明図である。即ち、図7の(a)における文字「あ」は太さが太くて、文字認識が困難であるが、それが図7の(b)のように細くされて明瞭に読み取りやすく変化されている。
【0065】
ここで、図3のステップS305bにおける線の太さの変更は例えば、図6のように線の太さを細くする処理を行って、文字全体の線を図7のように細くする。このような処理は、常法による2次元の数値処理によって可能である。このように、文字認識の確信度が所定の値に満たない場合は、その文字の大きさを変形したり、その太さを変形したり、あるいはその両方を変形することによって、文字認識の精度を高める。
【0066】
(結合補正処理)
ここで、上記のような文字変形によって文字の線が細くなったためにつながって書かれていた文字が離れてしまった場合、その文字の部分を再びつなげて、再び文字認識部103に入力する結合補正機能を、文字情報変更部105が有することが好ましい。実際、文字情報変更部105が、文字の線の太さを細く変更した際に、文字の線同士の結合部分が離れてしまう場合があるが、その際に、離れた線を再結合処理する。そして、再び文字認識部103にその文字を認識させることによって手書き文字の読み取り精度を向上させることができる。ここで結合部分が離れたかどうかの判定は、文字認識部103が判定するように構成する。
【0067】
図8は、本発明の実施の形態1による文字認識装置の文字情報変更部による結合補正処理を示すフローチャートである。このフローにおいてステップS801〜ステップS804までは、既述の文字の大きさ変更と文字の線の太さの変更のフローにおけるステップS301〜S304と同様である。既述のそのフローと異なる点を重点的に説明すると、文字の線を細く変更(ステップS805)したことにより、線と線の結合が離れた場所があるかどうかを、文字認識部103が判定する(ステップS807)。そのような個所があった場合は、座標情報変更部105が離れた線を結合(ステップS808)して、ステップS802に戻ることにより、再び文字認識部103が文字認識動作を行う。
【0068】
図9は、本発明の実施の形態1による文字認識装置で文字線を細くすることによって、結合していた文字の一部が離れたことを示す図である(ステップS807のYesの場合)。図10は、本発明の実施の形態1による文字認識装置によって離れた文字の一部を、再結合する処理がなされたことを示す図である。このように結合個所が離れたことを検出しそれを再び結合させる方式や方法は、常法において行われている2次元的数値処理を用いる。こうして、元もと結合していた文字の部分が細線化されることによって離れて読み取りにくくなったのを、元通りに結合して再度読み取るので、より精度の高い文字認識が可能となる。
【0069】
(離間補正処理)
また、本発明による文字認識装置は、文字情報変更部による変形によって文字の線が太くなったために、離れて書かれていた文字がつながってしまった場合、その文字のつながった部分を離間させて、再び文字認識部103に入力する離間補正機能を備えることが望ましい。すなわち、文字の線の離間補正処理は、文字変更処理によって文字の線の太さが太く変更されて、離れていた文字の線が結合してしまった場合に、結合した線を再び離す離間補正処理であり、それにより手書きされたパターンの特徴をより正確に表現して再び認識させるので、手書き文字認識の精度を向上させることができる。ここで離間部分が結合したかどうかの判定は、文字認識部103が判定可能と構成しうる。離間補正手段は、座標情報変更部105がその機能を実行可能と構成しうる。
【0070】
図11は、本発明の実施の形態1による文字認識装置が文字線を離間補正処理することを示すフローチャートである。この処理において、図8の結合補正処理と異なるステップについて重点的に説明する。ステップS1101〜ステップS1104までは、前述の結合補正処理におけるステップS801〜ステップS804までと同様である。文字の線が太く変更された場合(ステップS1105)、次に、文字認識部103は新たに線と線が結合した箇所があるかどうかを判定する(ステップS1107)。そして、そのような結合箇所が検知された場合(ステップS1107のYes)、座標情報変更部105は、結合した線を離す離間処理を施し(ステップS1108)、もう一度ステップS1102に戻る。
【0071】
図12は本発明の文字認識装置で文字線を太くすることによって、新たに結合個所が生じた例を示す説明図である。図12の(a)はもとの文字であり、(b)は太くなるように変形したことによって文字の線が結合してしまった例である。図13は、本発明による離間補正手段によって離間補正を行ったことを示す説明図である。図13(a)の(い)の部分を短くして(b)のように線を離した離間処理がなされた(ステップS1108)。こうして、もともと離れていた箇所が、文字変形処理したために結合してしまった箇所を、もとのように離れた状態に離間補正することによって、手書きされた文字のパターンをより忠実に残して再び文字認識させるので、より精度の高い文字認識が可能になる。このように、もとの離間個所が結合したことを検出し、それを再び離間させる方式や方法は、2次元的数値処理として常法を用いて実現できる。
【0072】
(つぶれ補正処理)
また、本発明においては、文字情報変更部105による変形によって文字の線が太くなったために文字の空白部分がつながって消失してしまった場合、その空白の消失部分に再び空白部分を復活させるつぶれ補正処理機能を有することが望ましい。つぶれ補正機能を備えることによって、文字の線の太さが太く変更されたことにより空白部分が黒で覆われてしまってつぶれた場合にも、もう一度その黒つぶれを補正して本来あった空白部分を復活させ、再び文字認識させることによって、手書き文字の読み取り精度を向上できる。ここで、つぶれが発生した、即ち空白部分が消失したかどうかの判定は、文字認識部103が判定可能と構成しうる。つぶれ補正機能は、座標情報変更部105が実行可能である。
【0073】
図14は、本発明の実施の形態1による文字認識装置がつぶれ補正処理を行うことを示すフローチャートである。ステップS1401〜ステップS1404までは、既述の結合補正処理におけるステップS801〜ステップS804までと同様である。つぶれ補正処理は以下、図8の結合補正処理と異なるステップについて重点的に説明する。線が太く変更された場合(ステップS1405)、文字の線の太さによって空白がつぶれた個所があるかどうかを、文字認識部103が判定する(ステップS1407)。黒つぶれがあったと判定された場合は、座標情報変更部105がつぶれた箇所を形成する線を細くして空白部分を復活させる(ステップS1408)。
【0074】
図15は、本発明の実施の形態1による文字認識装置によって空白がつぶれた文字の個所が補正される例を示す説明図である。図15(a)のように、文字の線を太くする(ステップS1405)ことによって、空白がつぶれた状態の発生を検出(ステップS1407)すると、図15の(b)のように、(う)(四角い囲み線)の線を細く変形する(ステップS1408)。それによって、つぶれた状態を修復することができる。このように、もともとの空白部分が黒つぶれしたことを検出し、それを再び空白部分に修正する方式や方法は、2次元的数値処理として常法を用いて実現可能である。
【0075】
以上、実施の形態1によると、文字認識の確信度が所定の値に満たない場合は、その文字の大きさを変形したり、その太さを変形したり、あるいはその両方を変形することによって、文字認識の精度を高めることができる。また、実施の形態1によると、元もと結合していた文字の部分が細線化されることによって離れて読み取りにくくなったものを元通りに結合して再度読み取ることにより、精度の高い文字認識が可能となる。さらに、実施の形態1によると、もともと離れた箇所が、文字変形処理したあと結合してしまったものを離れた状態に離間補正することによって、手書きされた文字のパターンをより忠実に残すので、より精度の高い文字認識が可能になる。さらに、実施の形態1によると、もともとの空白部分が黒つぶれしたことを検出して再び空白部分に修正するので、より精度の高い文字認識が可能になる。
【0076】
(実施の形態2)
実施の形態1においては、文字認識の確信度が所定の基準値に満たない場合、文字を拡大したり、文字の線の太さを変更したりして再び文字認識を行うものであったが、この実施の形態2では、確信度に応じて文字の大きさや文字の線の太さの変更倍率を設定しそれに基づいて変形を施して、再び文字認識を行うものである。この実施の形態2による文字認識装置は、図1に示されると同様に通信部101、加筆切り出し部102、文字認識部103、確信度判定部104、座標情報変更部105、および蓄積部106から構成される。ここでは、座標情報変更部105が実施の形態1と異なるので、座標情報変更部105の構成について述べる。
【0077】
実施の形態2では、文字の確信度に応じて変形倍率を決定する変形テーブルを有する。座標情報変更部105は、この変形テーブルに基づいて文字変形を行う。即ち、変形テーブル中の確信度に対応する変形倍率を読み取り、その変形倍率に基づいて文字を変形する。ここで、変形テーブルは、装置の例えば画像処理部に固定的に設定されていても良い。あるいは、変形テーブルは、変形テーブルファイル150として予めROMに書き込まれていても良い。あるいはまた、変形テーブルは、変形テーブルファイルとして記憶部106に格納されていても良い。また、その際ファイルは書き換え可能としても良い。以下では、変形テーブルが、変形テーブルファイル150として、記憶部106に格納されているものとして説明する。ここで変形テーブルファイルは、本発明における変形パターン情報を構成する。
【0078】
(確信度に応じた変形処理)
図16は本発明の実施の形態2による文字認識装置において、確信度に対応して文字の大きさを変えた文字認識の動作を示すフローチャートである。実施の形態1と異なるステップについてフローを説明する。ステップS1601〜ステップS1604までは、既述のステップS201〜ステップS204までと同様である。確信度判定部104が確信度と所定の基準値とを比較(ステップS1604)した後、確信度が基準値よりも低い場合(ステップS1604のNo)、座標情報変更部105は、記憶部106から読み出された変形パターンファイル157において示される変形テーブルの確信度に対応して定められた倍率を選択し、その倍率によって文字の大きさを変形する(ステップS1605)。そして、再び加筆切り出し部102、および文字認識部103へと送信する。ここで、加筆切り出し部102への送信を省略して文字認識部103へ直接送信しても可能である。
【0079】
図17は本発明の実施の形態2による文字認識装置において、確信度に対応して文字の線の太さを変える文字認識の流れを示すフローチャートである。ステップS1701〜ステップS1704までは、既述のステップS201〜ステップS204までと同様である。実施の形態1と異なるステップについてそのフローを説明する。文字認識の結果、所定の基準値とその時の確信度とを比較(ステップS1704)した後、確信度が基準値よりも低い場合(ステップS1704のNo)、変形テーブルにおいて確信度に対応して定められた文字の線の太さの倍率を用いて、座標情報変更部105は文字の線の太さを変形する(ステップS1705)。そして、再び加筆切り出し部102,および文字認識部103へと送信する。このステップでは加筆切り出し部102を省略して文字認識部103へと送信することも可能である。
【0080】
(文字の大きさの拡大処理、および太さの抑制処理)
次に、文字の大きさおよび文字の線の太さを、確信度の値に応じて段階的に変更する処理を説明する。
【0081】
図18は、本発明の実施の形態2による文字認識装置に用いる文字の大きさの変形テーブルである。図19および20は、本発明の実施の形態2による文字認識装置に用いる文字の太さの変形テーブルである。変形テーブルは、記憶部150に変形テーブルファイルとして格納されている。本発明における変倍情報は、上記の変形テーブルに相当する。変形テーブルは、手書き文字種毎に用意される。文字種毎に文字認識の特性が異なるからである。変形テーブルは、記憶部150から読み出されて、確信度に応じた拡大倍率が選択されて、その拡大(あるいは縮小)倍率によって手書き文字の大きさ、および線の太さの変更が指定される。その指定に基づいて、座標情報変更部105は、手書き文字に対して大きさまたは線の太さ、あるいはその両方の変更処理を施す。
【0082】
例えば、上記の認識処理において、文字の確信度が65%であった場合には、図18の変形テーブルに基づいて座標スケールを1.50倍に拡大する。これより文字は1.50倍に拡大される。しかし、そのままでは、同時に文字の線も太くなるので、一般にその線を細くする場合が多い。その場合、図19の確信度60以上70未満の欄から0.75倍が選択されて、その倍率を用いて文字の線が細くされる。こうすることによって、文字の大きさは拡大されるが、しかしその太さを同じ割合で拡大しないように制御できる。その反対に文字の太さを太くする方が認識しやすい場合は、あらかじめ拡大に伴って、例えば図20による変形テーブルを用いて線を太くするように設定することも可能である。
【0083】
あるいは、文字認識において文字の線が細くて2文字として認識されてしまう場合は、手動による設定によって、図20の変形テーブルを読み出し、確信度65%から線の太さの変更倍率として1.5倍が選択して、文字線の太さを1.5倍化する。
【0084】
(文字種ごとの変形)
ここで、文字種毎に異なる変形テーブルを用いる利点について詳述する。
例えば、ひらがな・カタカナは手書き入力パッド(図30)によって入力される手書き文字種のひとつであるが、この文字種には、促音(「っ」)、拗音(「ゃ」「ゅ」「ょ」)、その他小さなひらがな・カタカナ(「ぁ」「ぃ」「ぅ」「ぇ」「ぉ」「ヵ」「ヶ」「ァ」「ィ」「ゥ」「ェ」「ォ」)等がある。つまり、「ひらがな・カタカナ」には、他の文字との相対的な大きさにより、用法が変化する文字がある。そのため、確信度の値に応じて座標スケールを変更するとき、拡大倍率を大きく取ると、手書きした促音、拗音、その他、小さなひらがな・カタカナを、拡大しすぎることがあって、誤った文字認識の原因となる。
【0085】
図21は、小さなひらがなを拡大する例を示す説明図であり、図21の(a)は小さなひらがなを大きく拡大し過ぎた例を示す説明図であり、図21の(b)は小さなひらがなを適切に拡大した例を示す説明図である。文字認識装置10が図21(a)および(b)の変更後の文字を認識すると、それぞれ「しよう」と「しょう」と認識され、異なる認識結果を得ることになる。このような場合、確信度を判定し、それに基づき文字種によって設定された適切な拡大倍率が選択されることによって、より正確な認識が可能になる。
【0086】
大きさの変更情報は手書き文字種1つに対して、2つ以上用意する。それは、文字の大きさを大きくするものと小さくするものとを1以上備えて、拡大と縮小を適宜切り替えるためである。このように、手書き文字種に応じて適切な変形テーブルを用いることによって、文字認識装置は、高い精度でしかも、効率良く認識処理を施すことが可能になる。
【0087】
また、アラビア数字も手書き文字種のひとつである。例えば、手書き入力パッドで郵便番号を入力する場合には、文字の大きさが、字の用法に与える影響は小さい。従って、「ひらがな・カタカナ」と比較し、確信度に応じて拡大倍率を大きくとることが可能であり、例えば急激に大きくまたは、太くしても読み取り困難になりにくい。そのように拡大倍率を大きく設定した変更倍率を用いると、文字を拡大して認識するフローを表す図17のステップS1704→S1705→S1702→S1703の処理ループの回数が少なくて済む。この為、処理効率が向上する。
【0088】
図22は、数字の線の太さを拡大する例を示す説明図であり、図22の(a)は徐々に数字の線の太さを拡大した例であり、図22の(b)は急激に数字の線の太さを拡大した例である。図22の(b)においては、変更倍率を大きくとり、処理ループ1回で急激に太く変更している。こうして、処理ループのループ回数を減らすことができ処理効率が向上する。
【0089】
また、漢字も手書き入力パッド(図30)によって手書き入力される文字種のひとつである。漢字には、例えば「森」や「晶」など線が多く含まれ、画数の多い文字がある。線が多いほど、線の太さを太くすると文字がつぶれやすい。このとき、文字認識の流れにおいて、図17のステップS1704→S1705→S1702→S1703の処理ループにおいては、一度の処理ループで文字の線の太さを太くし過ぎて、文字を黒くつぶしてしまう恐れがある。しかし、複数の変形テーブルから選択することによって、数回の処理ループに分けて、少しずつ太くしながら確信度の変化を観察できるように、太さの変化量の少ない変形テーブルを用いることができる。
【0090】
図23は、漢字の線の太さを変更する例を示す説明図であり、図23の(a)は、急激に漢字の線の太さを太くした例の説明図であり、図23の(b)は、徐々に漢字の線の太さを太くした例の説明図である。すなわち、(a)では一度に太くし過ぎて文字がつぶれてしまって判別が困難となった。それに対して、(b)の例では、何度かの処理ループに分けて少しずつ太くした。こうして、少しずつ文字の線を太くすることにより、一度に文字がつぶれてしまうことが避けられ、正確な認識が可能となる。
【0091】
このように、手書き文字種毎に変形テーブルを用意すると認識の精度が高まり、それを用いることによって、本発明の実施の形態による文字認識装置は手書き文字種ごとに確信度と文字の線の太さを変化させて手書き文字の太さを好適に変化させることができる。太さの変形テーブルは手書き文字種1つに対して、2つ以上用意することが好ましい。それは、文字の太さを太くするものと細くするものとを1以上備え、また同じ方向の変化でも変化の粗密の選択肢があったほうが、読み取り精度が上がる。こうして、文字種毎に異なる文字の線の太さの変形テーブルを用いることによって、精度の高い文字認識が可能になる。こうして、実施の形態2によれば、確信度に応じて文字を変形させて認識させるので、効率よく適切な変形を迅速に得ることができ、また文字種ごとにその文字種に相応しい変形テーブルを用いることができるので、より正確な文字認識が可能となる。
【0092】
(実施の形態3)
実施の形態2では、確信度に応じて文字の大きさ、あるいは文字の線の太さを変倍させたが、この実施の形態3では、その認識結果によって確信度が低下する場合、文字の大きさ、あるいは線の太さの変更方向を変えて認識させる。この実施の形態3による文字認識装置は、図1に示されると同様に通信部101、加筆切り出し部102、文字認識部103、確信度判定部104、座標情報変更部105、および蓄積部106から構成される。ここでは、座標情報変更部105が実施の形態1および2と異なるので、座標情報変更部105の構成について述べる。
【0093】
実施の形態2においては、変形テーブルファイルを記憶部150に有して、それを読み出すことによって、確信度に応じた変形テーブルによる変形倍率を決定していたが、実施の形態3においても、変形テーブルファイルを記憶部150に有してそれを読み出すことによって変形テーブルから確信度に応じた変形倍率を決定する点は同様である。しかしながら、実施の形態3においては、文字認識において確信度が続けて低下する場合、読み込む変形テーブルを切り替えることによって、文字の変化の方向を切り替えることが特徴である。即ち、文字変形の方向が正反対の変形テーブルを備えて、座標情報変更部105がその選択を切り替えることによって、文字変形の方向を切り替える。
【0094】
(変倍方向の切り替え)
図24は、本発明の実施形態3による文字認識装置で文字の太さの変更の方向を切り替える手順を示すフローチャートである。変更方向の切り換えは、座標情報変更部105が行なう。
【0095】
図19および20の変形テーブルは、それぞれ太さの変更方向が異なる変形テーブルであり、変形テーブルファイル157に書き込まれ、記憶部150に格納されている。ここで、座標情報変更部105が、これらの変形テーブルの一方から他方へと読み取りを切り替えることによって、文字の太さの変更方向を切り替えることができる。
【0096】
ステップS2401〜ステップS2404までは、既述のステップS201〜ステップS204までと同様である。図24に示すように、確信度が基準値よりも下回ると(ステップS2404のNo)、ステップS2404における確信度の変化を調べて、後の方の確信度がそれより前の確信度を下回ると判定されると(ステップS2407のNo)、文字の太さの変形テーブルのうち使用するものを、現在使用しているものから使用していない他の変形テーブルであって変化の方向の異なるものへと切り替える(ステップS2408)。例えば、変形テーブルを図19から図20に切り替えて用いる。それにより、文字の線の太さの変更の方向を切り替えて、切り替えた変形テーブルによって、座標情報変更部105は文字の線の太さの変更倍率を読み取って、線の太さを変更する(ステップS2405)。その反対に前回の確信度を上回った場合は、そのまま変形テーブルを使用し続ける(ステップS2405)。このように文字を変形させて認識させることによって返って確信度が落ちる場合は、逆に文字の変形方向を切り替えることによって確信度の高まる方向に変形させ、それにより精度の高い文字認識が可能になる。
【0097】
(複合処理)
ここで、本発明の実施の形態3の文字認識装置において、文字の大きさ(座標スケール)と文字線の太さの変更を複合的に行う手順を説明する。図25は、本発明の実施の形態3による文字認識装置が、手書き文字に複合的変更処理を施す手順を示すフローチャートである。図26は、図25における座標スケール変更処理を示すフローチャートである。図27は、図25における文字の線の太さ変更処理を示すフローチャートである。
【0098】
最初に座標スケール変更処理を施し、次に文字の線の太さ変更処理を施す場合について述べる。座標情報取得装置100は手書き文字を読み取り、各々の座標情報が文字認識装置に入力され(ステップS2501)、その情報が切り出され、BMP形式などの画像として構成される(ステップS2502)。その後、座標スケールの変倍処理に進む。この座標スケール変倍処理は、座標情報変更部105において、1回(初回)から例えば3回まで行う。しかし、この回数は適宜設定可能である。その後、同じく座標情報変更部105において文字の線の太さの変更処理を施す。
【0099】
ここで、座標情報を切出し、BMP形式などの画像として構成するステップS2502と、文字認識するステップ2603A(図26)との間に、「座標スケール変倍処理が4回目以降であるかどうか」を判定する回数判定ステップS2611Aを入れる。座標スケールの変倍処理の回数の判定は、画像情報変更部105で判定可能としうる。そして、4回以上であった場合は座標スケールの変倍処理を行わずにただちに文字の線の太さ変倍処理(ステップS2500B)へと移行する。これにより、座標スケール変形(文字の大きさ変倍)処理を3回までに抑えることができる。
【0100】
文字の線の太さ変倍処理においては、図27に示すように、その太さの変倍方向を変える構成とする。文字認識を行って(ステップS2703B)、確信度が基準値を上回らない場合(ステップS2704BのNo)には、そのような確信度が基準値を上回らない状態が2回目であって、且つ前回の確信度を上回る場合(ステップS2707BのYes)は、同じ変形テーブルを用いて線の太さを変更する。しかし、その反対に、確信度が基準値を上回らない状態が2回目であって、且つ前回の確信度を下回る場合(ステップS2707BのNo)は、文字の太さ変形テーブルの太さ変更方向の異なる2つの内、使用している変形テーブルから使用していない変形テーブルへと切り替える。この変形テーブルの切り替えによって線の太さの変倍方向を切り替える(ステップS2708B)。
【0101】
なお、この複合的処理においては最初に座標スケールの変更処理を行ったが、その反対に最初に文字の線の大きさを変更する処理を行って、その後に座標スケール変更処理を行っても良い。
【0102】
(関数による変形パターン情報)
なお、本発明における変形パターン情報として、既述のような変形テーブル、あるいはテーブル形式に表現できるファイル形式のほかに、関数を用いたものを適用することができる。例えば、式
y=2−x       (1)
を用いる。ここでxは1を100%とした確信度であり、yは拡大率である。
例えば、確信度が0.5のとき倍率は1.75となり、確信度が1のときは倍率も1となり、式(1)によって表される関数は拡大因子となる。
【0103】
あるいは、式
z=x         (2)
を用いた場合、確信度xが0.5のとき倍率は0.25であり、確信度が1のときは倍率も1となり、式(2)によって表される関数は縮小因子となる。
【0104】
なお、以上は確信度を正しい認識の目安として、それに基づいて手書き文字を変形する構成であるが、他にも、認識すべき手書き文字を囲むある範囲において、文字の形状が実際に占有する部分の比率を、例えば「黒点占有率」と名づけて、その割合が一定範囲外にある場合には、当該文字を拡大または縮小、あるいは線の太さの変形などを施して再び認識させることにより、文字認識の精度を高める構成としても良い。これは、文字読み取りの良否を黒点占有率によって推測するものである。
【0105】
実施の形態3によれば、文字認識においてその認識結果によって確信度が返って低下する場合は、その文字の変形方向を変えることによって、より確信度が高まる方向に変形するので、適切な変更方向を選択して認識する効率的で精度の高い文字認識を可能にする。
【0106】
なお、本実施の形態の文字認識装置で実行される文字認識プログラムは、CD−ROMまたはFDなどにインストール可能な形式のファイルで提供される。なお、このようなインストール可能な形式のファイルを、ネットワークからのダウンロードで提供するようにしてもよい。
【0107】
【発明の効果】
以上説明したように、請求項1にかかる発明によれば、手書き文字の認識精度の高い文字認識装置を提供できるという効果を奏する。
【0108】
また、請求項2にかかる発明によれば、入力した手書き文字の大きさを変えて認識させるので、手書き文字の認識精度を高めた文字認識装置を提供できるという効果を奏する。
【0109】
また、請求項3にかかる発明によれば、確信度に応じて文字を変倍させて文字認識を行うので、手書き文字の認識精度を高めた文字認識装置を提供できるという効果を奏する。
【0110】
また、請求項4にかかる発明によれば、文字の線の太さを変更して認識させるので、認識精度の高い文字認識装置を提供できるという効果を奏する。
【0111】
また、請求項5にかかる発明によれば、確信度に応じて、文字の線の太さを変更して認識させるので、認識精度の高い文字認識装置を提供できるという効果を奏する。
【0112】
また、請求項6にかかる発明によれば、文字の大きさを大小に変更して認識させるので、認識精度の高い文字認識装置を提供できるという効果を奏する。
【0113】
また、請求項7にかかる発明によれば、文字の太さ変更の方向を変えて認識させるので、認識精度の高い文字認識装置を提供できるという効果を奏する。
【0114】
また、請求項8にかかる発明によれば、文字種ごとのパターンにより変形して認識させるので、精度の高い文字認識装置を提供できるという効果を奏する。
【0115】
また、請求項9にかかる発明によれば、文字種ごとに確信度に基づくパターンにより変形して認識させるので、精度の高い文字認識装置を提供できるという効果を奏する。
【0116】
また、請求項10にかかる発明によれば、文字種ごとの文字線の太さの変形パターンから選択して認識させるので、精度の高い文字認識装置を提供できるという効果を奏する。
【0117】
また、請求項11にかかる発明によれば、文字を変倍情報を用いて変形させ認識させることによって返って確信度が低下する場合は、他の変倍情報に切り替えて認識させるので、精度の高い文字認識装置を提供できるという効果を奏する。
【0118】
また、請求項12にかかる発明によれば、手書き文字の確信度を判定して変更し文字認識を行うので、精度の高い文字認識方法を提供できるという効果を奏する。
【0119】
また、請求項13にかかる発明によれば、手書き文字の大きさを変更し文字認識を行うので、精度の高い文字認識方法を提供できるという効果を奏する。
【0120】
また、請求項14にかかる発明によれば、手書き文字の太さを変更し文字認識を行うので、精度の高い文字認識方法を提供できるという効果を奏する。
【0121】
また、請求項15にかかる発明によれば、請求項12〜14のいずれか1つに記載された方法の動作をコンピュータによって実行できるという効果を奏する。
【図面の簡単な説明】
【図1】この発明の実施の形態1である文字認識装置の機能構成を示すブロック図である。
【図2】本発明の実施の形態1の文字認識装置による手書き文字認識の流れを示すフローチャートである。
【図3】本発明の実施の形態1による文字認識装置の手書き文字認識における、文字の大きさ変更と文字の線の太さの変更手順を示すフローチャートである。
【図4】本発明の実施の形態1による文字認識装置において、手書き文字の座標点を広げる処理を施した説明図である。
【図5】手書き文字の座標点を広げたことによって文字が拡大されるが、しかし、同時に文字線の太さが抑制処理される場合の1例を示す説明図である。
【図6】本発明の実施の形態1による文字認識装置によって手書き文字の線を細くする説明図である。
【図7】本発明の実施の形態1による文字認識装置によって手書き文字が細くされた説明図である。
【図8】本発明の実施の形態1による文字認識装置の文字情報変更部による結合補正処理を示すフローチャートである。
【図9】本発明の実施の形態1による文字認識装置で文字線を細くすることによって、結合していた文字の一部が離れたことを示す図である。
【図10】本発明の実施の形態1による文字認識装置によって離れた文字の一部を、再結合する処理されたことを示す図である。
【図11】本発明の実施の形態1による文字認識装置の文字線の離間補正処理を示すフローチャートである。
【図12】本発明の文字認識装置で文字線を太くすることによって、新たに結合個所が生じた例を示す説明図である。
【図13】本発明による離間補正手段によって離間補正を行ったことを示す説明図である。
【図14】本発明の実施の形態1による文字認識装置によるつぶれ補正処理を示すフローチャートである。
【図15】本発明の実施の形態1による文字認識装置によって、空白がつぶれた文字の個所が補正される例を示す説明図である。
【図16】本発明の実施の形態2による文字認識装置において、確信度に対応して文字の大きさを変える文字認識の流れを示すフローチャートである。
【図17】本発明の実施の形態2による文字認識装置において、確信度に対応して文字の線の太さを変える文字認識の流れを示すフローチャートである。
【図18】本発明の実施の形態2による文字認識装置に用いる文字の大きさの変形テーブルである。
【図19】本発明の実施の形態2による文字認識装置に用いる文字の太さの変形テーブルである。
【図20】本発明の実施の形態2による文字認識装置に用いる文字の太さの変形テーブルである。
【図21】本発明の実施の形態2による文字認識装置において、小さなひらがなを拡大する例を示す説明図であり、図21の(a)は小さなひらがなを大きく拡大し過ぎた例を示す説明図であり、図21の(b)は小さなひらがなを適切に拡大した例を示す説明図である。
【図22】本発明の実施の形態2による文字認識装置において、数字の線の太さを拡大する例を示す説明図であり、図22の(a)は徐々に数字の線の太さを拡大した例であり、図22の(b)は急激に数字の線の太さを拡大した例である。
【図23】
本発明の実施の形態2による文字認識装置において、漢字の線の太さを変更する例を示す説明図であり、図23の(a)は、急激に漢字の線の太さを太くした例の説明図であり、図23の(b)は、徐々に漢字の線の太さを太くした例の説明図である。
【図24】本発明の実施形態3による文字認識装置で文字の太さの変更の方向を切り替える手順を示すフローチャートである。
【図25】本発明の実施の形態3による文字認識装置の手書き文字の複合的変更処理を示すフローチャートである。
【図26】図25における座標スケール変更処理を示すフローチャートである。
【図27】図25における文字の線の太さの変更処理を示すフローチャートである。
【図28】従来の文字認識装置の機能的構成を示すブロック図である。
【図29】従来の文字認識装置の処理手順を示すフローチャートである。
【図30】一般的な手書き入力文字パッドによる手書き入力を示す模式的斜視図である。
【図31】従来の文字認識装置における時系列座標読取方式の処理手順を示すフローチャートである。
【符号の説明】
10、2810 文字認識装置
100、2800 座標情報取得装置
101、2801 通信部
102、2802 加筆切り出し部
103、2803 文字認識部
104 確信度判定部
105 座標情報変更部
106、2806 蓄積部
150 記憶部
151 座標情報ファイル
152 切出しデータファイル
153 文字変換ファイル
154 確信度ファイル
155 座標変更ファイル
156 認識済みファイル
157 変形テーブルファイル
3001 板状部
3002 ペン
3003 紙

Claims (15)

  1. 入力された手書き文字を文字認識する認識手段と、
    前記手書き文字の特徴点と前記認識手段によって認識された文字の特徴点との一致度を示す確信度を求め、前記確信度と所定基準値とを比較する判定手段と、
    前記判定手段によって前記確信度が所定基準値より低いと判定された場合、前記手書き文字に変形処理を施し、再び前記認識手段に入力する変形手段と、
    を備えたことを特徴とする文字認識装置。
  2. 前記変形手段は、前記手書き文字の大きさを変えることを特徴とする請求項1に記載の文字認識装置。
  3. 前記変形手段は、前記確信度に応じた変形倍率で前記手書き文字の大きさを変えることを特徴とする請求項2に記載の文字認識装置。
  4. 前記変形手段は、前記手書き文字の線の太さを変えることを特徴とする請求項1または2に記載の文字認識装置。
  5. 前記変形手段は、前記確信度に応じた変形倍率で前記手書き文字の線の太さを変えることを特徴とする請求項4に記載の文字認識装置。
  6. 前記認識手段が文字認識を複数回行って、前記判定手段が確信度の低下を検出した場合、前記変形手段は手書き文字の大きさの変形倍率の変化方向を変えることを特徴とする請求項2または3に記載の文字認識装置。
  7. 前記認識手段が文字認識を複数回行って、前記判定手段が確信度の低下を検出した場合、前記変形手段は手書き文字の線の太さの変化方向を変えることを特徴とする請求項4または5に記載の文字認識装置。
  8. 文字種毎に設定された確信度に応じた変形パターン情報を格納する記憶手段を更に有し、
    前記変形手段は、前記変形パターン情報に基づいて前記手書き文字に対して文字種ごとに変形処理を施すことを特徴とする請求項1に記載の文字認識装置。
  9. 前記変形パターン情報は、確信度に応じた文字の大きさの変倍情報を含むことを特徴とする請求項8に記載の文字認識装置。
  10. 前記変形パターン情報は、確信度に応じた手書き文字の線の太さの変倍情報を含むことを特徴とする請求項8または9に記載の文字認識装置。
  11. 前記変形パターン情報は、異なる変形倍率方向の複数の前記変倍情報を含み、
    前記変形手段は、前記認識手段による複数回の文字認識の結果、前記判定手段によって前記確信度の低下が検出された場合、既に選択されている前記変倍情報を他の前記変倍情報に切り替えることを特徴とする請求項9または10に記載の文字認識装置。
  12. 入力される手書き文字を認識する第1の認識工程と、
    前記入力される手書き文字の特徴点と前記認識手段によって認識された文字の特徴点との一致度を示す確信度を求め、前記確信度と所定基準値とを比較する判定工程と、
    前記判定工程において、前記確信度が所定基準値より低いと判定された場合、前記手書き文字に変形処理を施す変形工程と、
    その変形処理を施された文字を再び入力して文字認識を行う第2の認識工程と、
    を含むことを特徴とする文字認識方法。
  13. 前記手書き文字の変形工程は、前記手書き文字の大きさを変形することを特徴とする請求項12に記載の文字認識方法。
  14. 前記手書き文字の変形工程は、前記手書き文字の線の太さを変形することを特徴とする請求項12または13に記載の文字認識方法。
  15. 請求項12〜14のいずれか一つに記載された方法をコンピュータに実行させるプログラム。
JP2002235158A 2002-08-12 2002-08-12 文字認識装置、文字認識方法、およびその方法をコンピュータに実行させるプログラム Pending JP2004078366A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002235158A JP2004078366A (ja) 2002-08-12 2002-08-12 文字認識装置、文字認識方法、およびその方法をコンピュータに実行させるプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002235158A JP2004078366A (ja) 2002-08-12 2002-08-12 文字認識装置、文字認識方法、およびその方法をコンピュータに実行させるプログラム

Publications (1)

Publication Number Publication Date
JP2004078366A true JP2004078366A (ja) 2004-03-11

Family

ID=32019749

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002235158A Pending JP2004078366A (ja) 2002-08-12 2002-08-12 文字認識装置、文字認識方法、およびその方法をコンピュータに実行させるプログラム

Country Status (1)

Country Link
JP (1) JP2004078366A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010191909A (ja) * 2009-02-20 2010-09-02 Mitsubishi Heavy Ind Ltd 文字認識装置及び文字認識方法
JP2013182512A (ja) * 2012-03-02 2013-09-12 Casio Comput Co Ltd 手書き文字処理装置およびプログラム
US9330482B2 (en) 2013-02-12 2016-05-03 Seiko Epson Corporation Display apparatus and display method for capturing hand-drawn images

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010191909A (ja) * 2009-02-20 2010-09-02 Mitsubishi Heavy Ind Ltd 文字認識装置及び文字認識方法
JP2013182512A (ja) * 2012-03-02 2013-09-12 Casio Comput Co Ltd 手書き文字処理装置およびプログラム
US9330482B2 (en) 2013-02-12 2016-05-03 Seiko Epson Corporation Display apparatus and display method for capturing hand-drawn images

Similar Documents

Publication Publication Date Title
JP3400151B2 (ja) 文字列領域抽出装置および方法
US5687254A (en) Searching and Matching unrecognized handwriting
WO2020059527A1 (ja) フォント作成装置、フォント作成方法及びフォント作成プログラム
JP2007317022A (ja) 手書文字処理装置及び手書文字処理方法
JP2008158774A (ja) 画像処理方法、画像処理装置、プログラム、及び記憶媒体
WO2009147840A1 (ja) 画像検索装置および同画像検索装置に適用される画像検索用コンピュータプログラム
JP6055065B1 (ja) 文字認識プログラム、文字認識装置
US20230008529A1 (en) Gesture stroke recognition in touch-based user interface input
JP3634574B2 (ja) 情報処理方法及び装置
JP2004078366A (ja) 文字認識装置、文字認識方法、およびその方法をコンピュータに実行させるプログラム
JP4845761B2 (ja) 3次元モデルの形状簡略化装置及び3次元モデルの形状簡略化プログラム
JP2006227824A (ja) 図面認識方法および装置
JP5964078B2 (ja) 文字認識装置、文字認識方法およびプログラム
JP2010039769A (ja) 情報処理装置、情報処理方法及びプログラム
JPH07200735A (ja) 図形認識装置
JP2006277092A (ja) 文字画像切出装置、文字画像切出方法およびプログラム
JP3344538B2 (ja) 文字生成装置
JP2010092426A (ja) 画像処理装置、画像処理方法およびプログラム
KR102572995B1 (ko) 폴리곤 간소화 방법 및 이를 수행하는 장치
JPH1049624A (ja) 手書き文字認識方法及び装置
JP2011128687A (ja) 字形要素判定装置及び字形要素判定方法
WO2021192206A1 (ja) 画像認識システム、画像認識方法および非一時的なコンピュータ可読媒体
JP2001092924A (ja) パターン認識方法および装置
JPH01292587A (ja) 画像処理方法
JPS6129980A (ja) オンライン手書き図形認識装置