JP2004094734A - 文字認識方法および文字認識装置 - Google Patents
文字認識方法および文字認識装置 Download PDFInfo
- Publication number
- JP2004094734A JP2004094734A JP2002256913A JP2002256913A JP2004094734A JP 2004094734 A JP2004094734 A JP 2004094734A JP 2002256913 A JP2002256913 A JP 2002256913A JP 2002256913 A JP2002256913 A JP 2002256913A JP 2004094734 A JP2004094734 A JP 2004094734A
- Authority
- JP
- Japan
- Prior art keywords
- character
- extracted
- type
- recognition
- handwritten
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
【解決手段】特徴抽出手段103は、文字抽出手段102で抽出された文字群毎に、印刷活字と手書き文字の判定に用いる特徴量を一種類または複数種類抽出する。また、特徴量の値が求まらないか無意味である場合には、値として「不定」を抽出結果とする。
【選択図】 図1
Description
【発明の属する技術分野】
本発明は、入力画像より切り出した文字を認識処理する文字認識方法に関する。更に、本発明は、入力画像より切り出した文字が印刷活字であるか手書き文字であるかを判定し、その判定結果をもとに文字認識を行う文字認識装置に関する。
【0002】
【従来の技術】
印刷活字と手書き文字の判定結果に従い文字認識方法や文字認識辞書を切替える文字認識処理に関わる技術として、従来では、検出された文字の高さのバラツキを表す特徴量により判定を行う特開平05−189604号公報の方法(従来技術1)、検出された文字のサイズの頻度のエントロピーを特徴量として判定を行う特公平06−32074号公報の方法(従来技術2)、文字間隔の分散が実験値とほぼ等しい場合に印刷活字と判定し、そうでない場合はリジェクト文字数により判定を行う登録3045086号公報の方法(従来技術3)、検出された文字のストロークの方向性や太さ、直線性などの特徴量の内の一つまたは複数の組合せにより判定を行う特開平10−162102号公報の方法(従来技術4)、文字矩形の面積、横幅、高さ、高さと横幅の比率、矩形の中心と行の中心の距離、矩形の中心の間隔のバラツキを表す特徴量の内の一つまたは複数の組合せを用いる特開平10−214308号公報の方法(従来技術5)等が挙げられる。
【0003】
上記した各従来技術のうち、従来技術1,2,5は、印刷活字の文字サイズが一般に、ほぼ一定であることを利用しているが、印刷活字へのノイズの付着や、かすれによる文字サイズの変化によって、印刷活字でも文字サイズにバラツキが現われることがあり、従って文字サイズのバラツキを表す特徴量では印刷活字と手書き文字を明瞭に判別できない場合がある。また、「1」や「−」など、横幅や高さ、面積等が他の文字のそれからかけ離れている文字が、判定の対象となる文字群に多数含まれている場合や、文字が少ない場合等に於いて、印刷活字のサイズや面積のバラツキが大きくなる場合があり、従ってサイズや面積のバラツキによる判定は困難になる。
【0004】
また、従来技術3は、印刷活字に適した文字認識方法が手書き文字をリジェクトする確率が高く、手書き文字に適した文字認識方法が印刷活字をリジェクトする確率が高い場合には妥当な判定が行えるが、文字認識方法によってはそのようなリジェクト確率の差が全く期待できない場合もあるし、ノイズやかすれにより認識不能な文字が混入している場合は、誤った字種に適した文字認識方法で認識を行った場合の方がリジェクト文字数が少なくなってしまう場合もある。
【0005】
また、従来技術4で用いているストロークの方向性や直線性に関する特徴量は、漢字など直線状のストロークが大い文字を認識対象としている場合や、対象とする文字群の中の文字数が多く、直線状のストロークが多い場合には有効であるが、直線成分が少ない数字やアルファベットの小文字、平仮名等を扱う場合は直線成分が少ないため判定が困難である。
【0006】
【発明が解決しようとする課題】
上述したように従来では、ノイズやかすれによる文字の劣化、文字数の不足、判定対象の文字のサイズ等の例外等により、単独の特徴による判定が困難な場合が多いという問題があった。
【0007】
本発明は上記実情に鑑みなされたもので、入力画像より切り出した読み取り対象文字が、印刷活字であるか手書き文字であるかの判定を正確に行うことができる信頼性の高い文字認識が可能な文字認識方法及び文字認識装置を提供することを目的とする。
【0008】
【課題を解決するための手段】
本発明は、単独では正確な判定を可能としない特徴量を複数組み合わせて印刷活字であるか手書き文字であるかの判定を行う構成として、単独の特徴量を用いた場合より正確な判定を行うことができるようにした文字認識方法及び文字認識装置を特徴とする。
【0009】
また、本発明は、入力画像より切り出した読み取り対象文字が、印刷活字であるか手書き文字であるかその判断がつかない字種であるかを判定し、その判定結果により、印刷活字に適した文字認識手段、手書き文字に適した文字認識手段、または印刷活字と手書き文字の両方に適用可能な文字認識手段のいずれかを用いて文字認識を行う構成として、字種判定が困難な場合でも、字種判定の誤りによる精度低下を防ぐことができるようにしたことを特徴とする。
【0010】
即ち、本発明は、入力画像より抽出した文字群が手書き文字であるか印刷活字であるかをその特徴量をもとに判定し、その判定結果をもとに文字認識処理を実行する文字認識装置に於いて、前記入力画像より抽出した文字群から、印刷活字と手書き文字の判定に用いる複数の特徴量を抽出する特徴抽出手段と、前記特徴抽出手段で抽出した特徴量の各々について、値が求まる場合はその値の関数を、値が不定である場合は特徴量に対して予め定められた定数を、それぞれ注目特徴量に対応する関数値として、この関数値をもとに印刷活字と手書き文字の判定に用いる評価値を求め、この評価値が予め定められた閾値未満である場合は手書き文字、上記評価値が上記閾値以上である場合は印刷活字と判定する文字種判定手段と、前記文字種判定手段による判定結果が手書き文字である場合に前記文字抽出手段で抽出された文字を認識する手書き文字認識手段と、前記文字種判定手段による判定結果が印刷活字である場合に前記文字抽出手段で抽出された文字を認識する印刷活字認識手段とを具備したことを特徴とする。このように、特徴量を複数組み合わせて判定を行う機能をもつことで、単独の特徴量を用いた場合に比し、より正確な判定を行うことができる。また、値が不定となり得る特徴量についても評価値の計算式への組込みを可能とする仕組みを導入することで、より多くの特徴量の組込みを可能とし、より高精度な判定を行うことが可能となる。
【0011】
また、本発明は、入力画像より抽出した文字群が手書き文字であるか印刷活字であるかをその特徴量をもとに判定し、その判定結果をもとに文字認識処理を実行する文字認識装置であって、入力画像に対しノイズ除去及び二値化処理を行って認識対象領域を切り出す前処理手段と、前処理手段で切り出した認識対象領域から文字群を抽出する文字抽出手段と、前記文字抽出手段で抽出した文字群から、印刷活字と手書き文字の判定に用いる特徴量を一つまたは複数抽出する特徴抽出手段と、前記特徴抽出手段で抽出した特徴量を用いて前記文字抽出手段で抽出した文字群が、印刷活字、手書き文字、印刷活字であるか手書き文字であるか不明な不明字種のいずれであるかを判定する文字種判定手段と、前記文字種判定手段による判定結果が手書き文字である場合にその判定結果に従う辞書を用いて前記文字抽出手段で抽出された文字を認識する手書き文字認識手段と、前記文字種判定手段による判定結果が印刷活字である場合にその判定結果に従う辞書を用いて前記文字抽出手段で抽出された文字を認識する印刷活字認識手段と、前記文字種判定手段による判定結果が不明字種である場合にその判定結果に従う辞書を用いて前記文字抽出手段で抽出された文字を認識する不明字種認識手段とを具備したことを特徴とする。このように、字種判定が困難な場合に、印刷活字と手書き文字の両方に適用可能な文字認識手段(認識用辞書)を適用することにより、字種判定が困難な場合でも、字種判定の誤りによる精度低下を防ぐことができる。
【0012】
【発明の実施の形態】
本発明に於いては、単独では正確な判定を可能としない特徴量を複数組み合わせて正確な判定を行うことと、異常値を示すことがある特徴量や、抽出不能になる場合がある特徴量をも判定に利用している。
【0013】
本発明の第1実施形態は、図1に示すように、前処理手段101、文字抽出手段102、特徴抽出手段103、文字種判定手段104、手書き文字認識手段105、印刷活字認識手段106等の構成要素を有する。
【0014】
前処理手段101は、入力画像に対して、ノイズ除去や二値化、フォーム除去等を行って、認識対象領域を切り出す。文字抽出手段102は上記前処理手段101で切り出した認識対象領域から認識対象となる文字群を抽出する。特徴抽出手段103は上記文字抽出手段102で抽出した文字群から、印刷活字と手書き文字の判定を行うための特徴量を一つまたは複数抽出する。
【0015】
文字種判定手段104は、上記特徴抽出手段103で抽出した特徴量の関数として、手書き文字と印刷活字の判定を行うための評価値を計算し、予め定められた閾値との比較により、「印刷活字」であるか「手書き文字」であるかを判定し、その結果が「印刷活字」なら印刷活字認識手段106により上記抽出した文字群の認識を行い、「手書き文字」なら手書き文字認識手段105により上記抽出した文字群の認識を行う。
【0016】
また、本発明の第2実施形態は、図10に示すように、上記図1に示す第1実施形態の各構成要素に加えて、不明字種認識手段207を有する。
【0017】
文字種判定手段204は、上記特徴抽出手段203で抽出した特徴量の関数として、手書き文字と印刷活字の判定を行うための評価値を計算し、予め定められた閾値との比較により、「印刷活字」であるか「手書き文字」であるか「印刷活字であるか手書き文字かが不明な字種」であるかを判定し、その結果が「印刷活字」であれば印刷活字認識手段206により、「手書き文字」であれば手書き文字認識手段205により、また「不明字種」であれば不明字種認識手段207によって、それぞれ抽出した文字群の認識を行う。
【0018】
ここで上記文字種判定手段104,204での評価値の計算は、各特徴量uiの関数gi(ui)の関数f(g1(u1),…,gN(uN))によって行われるが、値が不定となる特徴量uiについては、gi(ui)の替わりに定数を用いることによって、値が不定となり得る特徴量の利用も可能としている。
【0019】
以下に本発明の各実施形態について具体例を挙げて説明する。尚、本発明の処理機能およびその処理手順については、汎用のコンピュータに、文字認識用のソフトウェアを組み込むことによって構成できるため、以下ではそのような構成を仮定して説明を行う。ただし、本発明は各手段を専用ハードウェアの集合体や分散処理用のコンピューターのネットワークシステムとしても構成することもでき、上述の手段の全てを具備する構成ならば、ここで挙げた構成に限らず、どのようなもので実施してもよい。
【0020】
先ず図1乃至図9を参照して本発明の第1実施形態を説明する。
【0021】
図1に於いて、前処理手段101では、入力された画像(スキャナで読み取った文書画像)に対して、処理対象の欄の周辺の画像の切り出しや、二値化、ノイズ除去、フォーム除去等の画像処理が行われる。また、認識対象が帳票上の文字である場合は、罫線やプレプリント等のフォームの除去も行われる。
【0022】
文字抽出手段102では前処理手段101の出力画像から、認識対象となる文字群の文字毎の画像と位置情報の抽出が行われる。
【0023】
特徴抽出手段103では、文字抽出手段102で抽出された文字群毎に、印刷活字と手書き文字の判定に用いる特徴量が一種類または複数種類抽出される。また、特徴量と入力によっては、特徴量の値が求まらないか無意味である場合があるので、そのような場合には、値として「不定」を抽出結果とする。
【0024】
抽出する特徴量としては、例えば、以下で説明する、「文字矩形の端の並びからのずれ」を表す特徴量u1、「同じ文字の字形の不一致」を表す特徴量u2、「文字認識方法毎のリジェクト文字数の違い」を表す特徴量u3の3種類が挙げられる。
【0025】
ここでは、これら3種類の特徴量u1、u2、u3を適用するものとする。この3種類の特徴量u1、u2、u3の抽出方法について述べる。
【0026】
先ず文字矩形の端の並びからのずれを表す特徴量u1の抽出方法について、図4及び図5を参照して説明する。
【0027】
文字矩形の端の並びからのずれを表す特徴量u1は、文字群中の文字数をN、n番目の文字の外接矩形の上端のY座標をytn、n番目の文字の外接矩形の下端のY座標をybnとおくと、次の式で求められるyt,ybについて、
【数1】
【数2】
yb−ytを最小化するαを勾配法で求め、計算式
【数3】
を計算することによって求める。ただし、median(xn)は全nについてのxnの中央値とする。
【0028】
上記の方法で求めたyt、yb、αにより文字の上端と下端の並びが
【数4】
【数5】
と近似されるので(図4参照)、
|ytn−(nα+yt)|,|ybn−(nα+yb)|
はn番目の文字の上端、下端の文字並びからのずれを表し、u1は文字矩形の端の並びからのずれの評価尺度として機能する(図5参照)。
【0029】
上記(式3)は、N=1の場合、必ず0になり、印刷活字、手書き文字の違いとは無関係なので、N=1の場合はu1を「不定」とする。
【0030】
次に、同じ文字の字形の不一致を表す特徴量u2について図6乃至図9を参照して説明する。
【0031】
同じ文字の字形の不一致を表す特徴量u2は、文字の種類の数をC、文字の種類の番号をc、n番目の文字の認識結果の文字の種類の番号をcn、n番目の文字の画像の前景画素数をan、n番目の文字とm番目の文字の画像の左上の角を図6に示すように合わせて重ね合わせた時に、両方の画像で黒画素である画素の個数をvm,nとおくと、
【数6】
によって求める。
【0032】
ここでは、二つの文字画像を重ねる際に左上の角を合わせているが、図7に示すように、重心や二つの文字画像の外接矩形の中心を合わせて重ね合わせる方法、図8に示すように、外接矩形の上辺の中心(図5)を合わせて重ね合わせる方法、または図9に示すように、下辺の中心を合わせて重ね合わせる方法等であっもよい。この際、同じ文字が文字群に含まれていない場合は、上記(式6)を計算することができないので、u2を「不定」とする。
【0033】
次に、文字認識方法毎のリジェクト文字数の違いを表す特徴量u3について説明する。文字認識方法毎のリジェクト文字数の違いを表す特徴量u3は、印刷活字に適した文字認識方法と、手書き文字に適した文字認識方法の二種類の文字認識方法により、文字群中の一部または、全部の文字の認識を行った後、印刷活字に適した文字認識方法でのリジェクト文字数rpと手書き文字に適した文字認識方法でのリジェクト文字数rhから次の式で求める。
【0034】
【数7】
【0035】
リジェクト文字数rpとrhを求めるために行った文字認識の結果は、そのまま廃棄してもよいが、廃棄せずに保存しておき、手書き文字認識手段と印刷活字認識手段106でキャッシュデータとして利用してもよい。
【0036】
以上では、特徴抽出手段103で抽出する特徴量の例として、3種類の特徴量を示したが、特徴抽出手段103で抽出する特徴量としては、印刷活字と手書き文字との違いを表していると考えられるものならば、上記した以外にいかなる量を用いてもよく、その種類の個数も任意である。
【0037】
文字種判定手段104では、特徴抽出手段103で抽出した特徴をもとに、文字抽出手段102で抽出した文字群が、印刷活字であるか、あるいは手書き文字であるかを示す評価値sを求めて、この評価値sが予め定められた閾値θより大きい場合は印刷活字、閾値θ以下である場合は手書き文字であるとの判定が行われる。
【0038】
特徴量の個数をd、i番目の特徴量をuiとおくと、評価値sは関数f、関数群giにより
【数8】
と求められる。
【0039】
gi(ui)としては、
【数9】
を用いることができる。ただし、ciは予め定められた定数である。この際の定数ciを選択的に用いる関数群giの概念図を図2に示している。
【0040】
関数fとしては、gi(ui)の線形結合
【数10】
を用いることができる。ただし、wiは予め定められた定数である。
【0041】
以上の例では、fとして、gi(ui)線形結合を用いているが、fとしては、gi(ui)の二次形式
【数11】
をはじめ、gi(ui)の関数ならば、いかなる関数を用いてもよい。
【0042】
ただし、
【数12】
であり、Wは予め定められた対称行列である。
【0043】
また、gi(ui)としては、
【数13】
を用いることもできる。この際の定数ciを選択的に用いる関数群giの概念図を図3に示している。
【0044】
hiとしては、
【数14】
をはじめ、uiの関数ならば、いかなる関数を用いてもよい。ただし、βi,γiは予め定められた定数である。
【0045】
文字種判定手段104による判定結果が、手書き文字である場合には、文字抽出手段102で抽出された文字が手書き文字認識手段105によって認識され、文字種判定手段104による判定結果が、印刷活字である場合には、印刷活字認識手段106によって認識され、その認識結果が出力される。この際、手書き文字認識手段105と、印刷活字認識手段106とは、それぞれ学習機能を含む辞書内容及び認識アルゴリズムを異にする。
【0046】
次に本発明の第2実施形態を説明する。この第2実施形態は、図10に示すように、前処理手段201、文字抽出手段202、特徴抽出手段203、文字種判定手段204、手書き文字認識手段205、印刷活字認識手段206、不明字種認識手段207等の構成要素を有する。ここで、前処理手段201、文字抽出手段202、特徴抽出手段203、手書き文字認識手段205、印刷活字認識手段206は、それぞれ上記図1に示す第1実施形態と同様の機能構成であり、ここでは具体的な動作説明を省略する。
【0047】
文字種判定手段204は、特徴抽出手段203で抽出した特徴量を用いて、文字抽出手段202で抽出した文字群が、印刷活字であるか、手書き文字であるか、印刷活字であるか手書き文字かが不明な字種であるかの判定を行う。即ち、文字種判定手段204は、特徴抽出手段203で抽出した特徴をもとに、文字抽出手段202で抽出した文字群が、印刷活字であるか、あるいは手書き文字であるかを示す評価値sを求め、この評価値sが予め定められた閾値θpより大きい場合は印刷活字、評価値sが予め定められた閾値θhより小さい場合は手書き文字と判定する。また、評価値sが[s<=θpかつs>=θh]である場合は、印刷活字であるか手書き文字かが不明な字種であると判定する。
【0048】
文字種判定手段204による判定結果が、手書き文字である場合には、文字抽出手段202で抽出された文字を手書き文字認識手段205によって認識し、印刷活字である場合には印刷活字認識手段206によって認識し、印刷活字であるか手書き文字であるかが不明な字種であると判定した場合には、不明字種認識手段207によって認識して、その認識結果を出力する。この第2実施形態に於いても手書き文字認識手段205と、印刷活字認識手段206と、不明字種認識手段207とは、それぞれ学習機能を含む辞書内容及び認識アルゴリズムを異にする。
【0049】
【発明の効果】
以上詳記したように本発明によれば、入力画像より切り出した読み取り対象文字が、印刷活字であるか手書き文字であるかの判定を正確に行うことができる信頼性の高い文字認識が可能となる。即ち、本発明によれば、単独では正確な判定を可能としない特徴量を複数組み合わせることにより、単独の特徴量を用いた場合より正確な判定を行うことができる。また、値が不定となり得る特徴量についても評価値の計算式への組込みを可能とする仕組みを導入することにより、より多くの特徴量の組込みを可能とし、より高精度な判定を行うことが可能である。また、字種判定が困難な場合に印刷活字と手書き文字の両方に適用可能な文字認識方法を適用することにより、字種判定が困難な場合でも、字種判定の誤りによる精度低下を防ぐことができる。
【図面の簡単な説明】
【図1】本発明の第1実施形態に於ける要部の構成を示すブロック図。
【図2】上記実施形態に於ける(9式)の概念図。
【図3】上記実施形態に於ける(13式)の概念図。
【図4】上記実施形態に於ける特徴量u1の抽出方法を説明するための図。
【図5】上記実施形態に於ける特徴量u1の抽出方法を説明するための図。
【図6】上記実施形態に於ける特徴量u2の抽出方法を説明するための図。
【図7】上記実施形態に於ける特徴量u2の抽出方法を説明するための図。
【図8】上記実施形態に於ける特徴量u2の抽出方法を説明するための図。
【図9】上記実施形態に於ける特徴量u2の抽出方法を説明するための図。
【図10】本発明の第2実施形態に於ける要部の構成を示すブロック図。
【符号の説明】
101,201…前処理手段
102,202…文字抽出手段
103,203…特徴抽出手段
104,204…文字種判定手段
105,205…手書き文字認識手段
106,206…印刷活字認識手段
207…不明字種認識手段
Claims (10)
- 入力画像より文字群を抽出し、抽出した文字群から手書き文字と印刷活字の判定を行うための所定数の特徴量を抽出し、抽出した特徴量から前記文字群が印刷活字であるか手書き文字であるかを判定して、その判定結果に従い、手書き文字認識用の辞書を用いた文字認識処理、若しくは印刷活字認識用の辞書を用いた文字認識処理を実行する文字認識方法に於いて、
前記文字群が印刷活字であるか手書き文字であるかを判定する処理に、
前記抽出した特徴量の各々について、値が求まる場合はその値の関数を、値が不定である場合は予め定められた定数を、それぞれ注目する特徴量に対応する関数値として取得するステップと、
前記ステップで取得した関数値をもとに前記判定に用いる評価値を求めるステップと、
前記ステップで求めた評価値が予め定められた閾値未満であるか否かにより、前記抽出した文字群が手書き文字であるか印刷活字であるかを判定するステップと
を具備したことを特徴とする文字認識方法。 - 入力画像より抽出した文字群が手書き文字であるか印刷活字であるかをその特徴量をもとに判定し、その判定結果をもとに文字認識処理を実行する文字認識方法に於いて、
前記特徴量から、前記抽出した文字群が、印刷活字、手書き文字、不明字種のいずれであるかを判定する文字種判定ステップと、
前記文字種判定ステップによる判定結果に従い、予め用意された印刷活字認識用の辞書、手書き文字認識用の辞書、不明字種認識用の辞書から、対応する辞書を用いて前記抽出された文字を認識する認識ステップと
を具備したことを特徴とする文字認識方法。 - 入力画像から認識対象領域を切り出す前処理ステップと、
前記前処理ステップで切り出した認識対象領域から文字群を抽出する文字抽出ステップと、
前記文字抽出ステップで抽出した文字群から、印刷活字と手書き文字の判定に用いる複数の特徴量を抽出する特徴抽出ステップと、
前記特徴抽出ステップで抽出した特徴量を用いて抽出した文字群が印刷活字であるか手書き文字であるかの判定を行う文字種判定ステップと、
前記文字種判定ステップによる判定結果が手書き文字である場合に前記文字抽出ステップで抽出された文字を認識する手書き文字認識ステップと、
前記文字種判定ステップによる判定結果が印刷活字である場合に前記文字抽出ステップで抽出された文字を認識する印刷活字認識ステップとを有し、
前記文字種判定ステップは、前記特徴抽出ステップで抽出した特徴量の各々について、値が求まる場合はその値の関数を、値が不定である場合は特徴量に対して予め定められた定数を、それぞれ注目特徴量に対応する関数値として、この関数値をもとに評価値を求め、この評価値が予め定められた閾値未満である場合は手書き文字、上記評価値が上記閾値以上である場合は印刷活字と判定することを特徴とする文字認識方法。 - 入力画像から認識対象領域を切り出す前処理ステップと、
前記前処理ステップで切り出した認識対象領域から文字群を抽出する文字抽出ステップと、
前記文字抽出ステップで抽出した文字群から、印刷活字と手書き文字の判定に用いる特徴量を一つまたは複数抽出する特徴抽出ステップと、
前記特徴抽出ステップで抽出した特徴量を用いて、前記文字抽出ステップで抽出した文字群が、印刷活字、手書き文字、印刷活字であるか手書き文字かが不明な字種のいずれであるかを判定を行う文字種判定ステップと、
前記文字種判定ステップによる判定結果が手書き文字である場合に前記文字抽出ステップで抽出された文字を認識する手書き文字認識ステップと、
前記文字種判定ステップによる判定結果が印刷活字である場合に前記文字抽出ステップで抽出された文字を認識する印刷活字認識ステップと、
前記文字種判定ステップによる判定結果が不明な字種であると判定された場合に前記文字抽出ステップで抽出された文字を認識する不明字種認識ステップと
を具備したことを特徴とする文字認識方法。 - 前記特徴抽出ステップで抽出する特徴量には、前記文字抽出ステップで抽出した文字群の文字矩形の端の並びからのずれを表す量をもとに抽出した特徴量を含む請求項3または4記載の文字認識方法。
- 前記特徴抽出ステップで抽出する特徴量には、前記文字抽出ステップで抽出した文字群について同じ文字の字形の不一致を表す量を用いて抽出した特徴量を含む請求項3または4記載の文字認識方法。
- 入力画像に対しノイズ除去及び二値化処理を行って認識対象領域を切り出す前処理手段と、
前処理手段で切り出した認識対象領域から文字群を抽出する文字抽出手段と、
前記文字抽出手段で抽出した文字群から、印刷活字と手書き文字の判定に用いる複数の特徴量を抽出する特徴抽出手段と、
前記特徴抽出手段で抽出した特徴量の各々について、値が求まる場合はその値の関数を、値が不定である場合は特徴量に対して予め定められた定数を、それぞれ注目特徴量に対応する関数値として、この関数値をもとに印刷活字と手書き文字の判定に用いる評価値を求め、この評価値が予め定められた閾値未満である場合は手書き文字、上記評価値が上記閾値以上である場合は印刷活字と判定する文字種判定手段と、
前記文字種判定手段による判定結果が手書き文字である場合に前記文字抽出手段で抽出された文字を認識する手書き文字認識手段と、
前記文字種判定手段による判定結果が印刷活字である場合に前記文字抽出手段で抽出された文字を認識する印刷活字認識手段と
を具備したことを特徴とする文字認識装置。 - 入力画像に対しノイズ除去及び二値化処理を行って認識対象領域を切り出す前処理手段と、
前処理手段で切り出した認識対象領域から文字群を抽出する文字抽出手段と、
前記文字抽出手段で抽出した文字群から、印刷活字と手書き文字の判定に用いる特徴量を一つまたは複数抽出する特徴抽出手段と、
前記特徴抽出手段で抽出した特徴量を用いて前記文字抽出手段で抽出した文字群が、印刷活字、手書き文字、印刷活字であるか手書き文字であるか不明な不明字種のいずれであるかを判定する文字種判定手段と、
前記文字種判定手段による判定結果が手書き文字である場合にその判定結果に従う辞書を用いて前記文字抽出手段で抽出された文字を認識する手書き文字認識手段と、
前記文字種判定手段による判定結果が印刷活字である場合にその判定結果に従う辞書を用いて前記文字抽出手段で抽出された文字を認識する印刷活字認識手段と、
前記文字種判定手段による判定結果が不明字種である場合にその判定結果に従う辞書を用いて前記文字抽出手段で抽出された文字を認識する不明字種認識手段と
を具備したことを特徴とする文字認識装置。 - 前記特徴抽出手段で抽出する特徴量には、前記文字抽出手段で抽出した文字群の文字矩形の端の並びからのずれを表す量をもとに抽出した特徴量を含む請求項7または8記載の文字認識装置。
- 前記特徴抽出手段で抽出する特徴量には、前記文字抽出ステップで抽出した文字群について同じ文字の字形の不一致を表す量を用いて抽出した特徴量を含む請求項7または8記載の文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002256913A JP3914119B2 (ja) | 2002-09-02 | 2002-09-02 | 文字認識方法および文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002256913A JP3914119B2 (ja) | 2002-09-02 | 2002-09-02 | 文字認識方法および文字認識装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006001484A Division JP2006107534A (ja) | 2006-01-06 | 2006-01-06 | 文字認識方法および文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004094734A true JP2004094734A (ja) | 2004-03-25 |
JP3914119B2 JP3914119B2 (ja) | 2007-05-16 |
Family
ID=32061995
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002256913A Expired - Fee Related JP3914119B2 (ja) | 2002-09-02 | 2002-09-02 | 文字認識方法および文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3914119B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011018337A (ja) * | 2009-07-10 | 2011-01-27 | Palo Alto Research Center Inc | 文書内のテキスト行を区分するための方法 |
JP2013085546A (ja) * | 2011-10-24 | 2013-05-13 | Nikon Corp | 画像処理装置および方法、並びにプログラム |
JP2016182142A (ja) * | 2016-07-05 | 2016-10-20 | 株式会社ニコン | 画像処理装置および方法、並びにプログラム |
-
2002
- 2002-09-02 JP JP2002256913A patent/JP3914119B2/ja not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011018337A (ja) * | 2009-07-10 | 2011-01-27 | Palo Alto Research Center Inc | 文書内のテキスト行を区分するための方法 |
JP2013085546A (ja) * | 2011-10-24 | 2013-05-13 | Nikon Corp | 画像処理装置および方法、並びにプログラム |
JP2016182142A (ja) * | 2016-07-05 | 2016-10-20 | 株式会社ニコン | 画像処理装置および方法、並びにプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP3914119B2 (ja) | 2007-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100658119B1 (ko) | 문자 인식 장치 및 방법 | |
Aradhye | A generic method for determining up/down orientation of text in roman and non-roman scripts | |
US7336813B2 (en) | System and method of determining image skew using connected components | |
Namboodiri et al. | Document structure and layout analysis | |
US8059868B2 (en) | License plate recognition apparatus, license plate recognition method, and computer-readable storage medium | |
US8229248B2 (en) | Methods and systems for identifying the orientation of a digital image | |
JPH05242292A (ja) | 分離方法 | |
JPH09179937A (ja) | 文書画像のセンテンスの境界の自動識別方法 | |
US12045580B2 (en) | Translation pen and control method therefor | |
JP5600723B2 (ja) | 様々な文字幅を有するテキスト行の文字を分割するための方法及びシステム | |
US10423851B2 (en) | Method, apparatus, and computer-readable medium for processing an image with horizontal and vertical text | |
Yin | Skew detection and block classification of printed documents | |
JP2000315247A (ja) | 文字認識装置 | |
CN111274961A (zh) | 一种柔性ic基板字符识别和信息解析方法 | |
Sánchez et al. | Automatic line and word segmentation applied to densely line-skewed historical handwritten document images | |
KR20010015046A (ko) | 구조화된 배경 모델과 문자의 조합에 의한 배경위의 문자자동 인식 방법 | |
US20060078204A1 (en) | Image processing apparatus and method generating binary image from a multilevel image | |
JP2006107534A (ja) | 文字認識方法および文字認識装置 | |
JP3914119B2 (ja) | 文字認識方法および文字認識装置 | |
WO2006080568A1 (ja) | 文字読取り装置、文字読取り方法及び該文字読取り装置に用いられる文字読取り制御プログラム | |
JPH0410087A (ja) | 基本ライン抽出方法 | |
JPH02116987A (ja) | 文字認識装置 | |
JP2827960B2 (ja) | 宛名行抽出装置 | |
JPS6316392A (ja) | 文字認識装置 | |
Fadeel | An efficient segmentation algorithm for arabic handwritten characters recognition system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20051019 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051108 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060106 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20060106 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20060110 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20060328 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20060328 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061003 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061204 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070130 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070201 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 3914119 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100209 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110209 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120209 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130209 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140209 Year of fee payment: 7 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |