JP2007133850A - 文字認識装置、その文字認識方法及び文字認識プログラムならびに集積回路 - Google Patents

文字認識装置、その文字認識方法及び文字認識プログラムならびに集積回路 Download PDF

Info

Publication number
JP2007133850A
JP2007133850A JP2006083726A JP2006083726A JP2007133850A JP 2007133850 A JP2007133850 A JP 2007133850A JP 2006083726 A JP2006083726 A JP 2006083726A JP 2006083726 A JP2006083726 A JP 2006083726A JP 2007133850 A JP2007133850 A JP 2007133850A
Authority
JP
Japan
Prior art keywords
character
candidate
similarity
image
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006083726A
Other languages
English (en)
Other versions
JP4861730B2 (ja
Inventor
Minoru Takakura
穂 高倉
Mariko Takenouchi
磨理子 竹之内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2006083726A priority Critical patent/JP4861730B2/ja
Publication of JP2007133850A publication Critical patent/JP2007133850A/ja
Application granted granted Critical
Publication of JP4861730B2 publication Critical patent/JP4861730B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

【課題】文書や帳票の読み取りにおいて、手書き文字でも正確に認識するとともに、認識結果の誤認識や判読困難な文字を精度よく棄却する文字認識装置を提供する。
【解決手段】文字画像抽出部106は、文書画像入力受付部104で受け付けられた文書画像から文字画像を切り出す。特徴量抽出部106は文字画像から特徴量を抽出する。候補文字選択部107は分類辞書101の基準特徴量と抽出された特徴量との類似度を算出し候補文字を選択する。候補文字判定部109は選択された候補文字同士が類似候補文字識別辞書102に記載されているとき、いずれの文字が適切か判定する。個別文字検証部110は、候補文字を個別検証辞書103の肯定条件又は否定条件に示されるルールに従い「有効」又は「棄却」とする。認識検証部112は、同一文字行に複数の同一候補文字があるとき、文字画像同士の類似度rを用いて、候補文字の変更処理を行う。
【選択図】図1

Description

本発明は、文字認識技術に関し、特に、様々な書体の文書や手書き帳票等、字形の変動の甚だしい文字を認識する文字認識装置及びその方法に関する。
従来の文字認識装置には、多数の学習用文字画像から抽出した特徴量をクラスタリングし、クラスタごとの平均特徴量を基準特徴量として格納した分類用辞書と、読み込んだ画像より切り出した文字画像から幾つかの特徴を抽出する分類特徴抽出手段と、抽出した特徴量と分類用辞書中の基準特徴量とを照合し、候補クラスタを選出する分類手段と、分類手段で得られた候補クラスタの内の誤認識しやすい特定の組について、分類で使用した特徴量から、両クラスタ間で差異の出やすい特徴量のみを選択的に用いて、いずれのクラスタであるかを識別する詳細識別手段と、詳細識別手段で第1位に選ばれたクラスタに特徴的な特徴量の値域を用いて、認識結果の正当性を検証する検証手段とを有するものがある(特許文献1参照)。
特開平8−305804号公報
しかしながら、前記従来の構成では、分類処理、詳細識別処理、検証処理ともに同じ特徴量を用いているため、特に字形の変動の甚だしい手書き文字の場合、切り出した文字画像から抽出した特徴量が、分類用辞書内の基準特徴量のいずれに対しても類似度が低い場合には、分類処理、詳細識別処理、検証処理の各処理ともが良好には機能せず、誤認識や認識結果の棄却が増えるという課題を有している。
本発明は、前記従来の課題を解決するもので、文書や帳票の読み取りにおいて、字形の変動の甚だしい手書き文字でも正確に認識するとともに、認識結果が誤っている場合あるいは判読困難な文字を認識した結果を精度よく棄却する文字認識装置を提供することを目的とする。
上記課題を解決するため、本発明は、文書画像の入力を受け、文書画像に含まれる各文字を認識する文字認識装置であって、各文字の基準特徴量を登録した分類辞書と、文書画像から文字画像を抽出する文字画像抽出手段と、抽出された文字画像からその特徴量を抽出する特徴量抽出手段と、抽出された特徴量と前記基準特徴量との類似度を計算し、類似度の高い文字を候補文字として選択する候補文字選択手段と、前記特徴量抽出手段で抽出された特徴量を用いて、同一文書内の文字画像同士の類似度を計算する類似度計算手段と、候補文字としての類似度と、前記文字画像同士の類似度とに基づいて、候補文字として認識の確かさを検証する認識検証手段とを備えることとしている。
上述の構成によって、字形の変動の甚だしい手書き文字の場合でも、同一文書内の文字画像同士の類似度を反映させて認識結果が正しいか否かについて検証するので、文書画像を正確に認識することができる。
また、前記認識検証手段は、前記類似度計算手段で計算された検証対象文字との類似度rと、前記候補文字選択手段で計算された類似度Rとの積を計算する計算部と、前記候補文字選択手段で選択された同一候補文字についての積よりも大きな積を有する他の候補文字があるとき、前記検証対象文字の認識結果を前記他の候補文字に変更する認識結果変更部とを有することとしている。
このような構成によって、同一文書内の文字画像同士は、似通った特徴を有することを利用して、選択された候補文字を同一文書内の他の候補文字に変更することが可能となる。
また、文字ごとに候補文字として備えるべき形態特徴量を示した肯定条件と、候補文字として備えるべきでない形態特徴量を示した否定条件とをルールとして記載した個別検証辞書と、前記文字画像から形態特徴量を抽出し、選択された候補文字が肯定条件又は否定条件の何れに適合するかを判定し、否定条件に適合すると判定されたとき、その候補文字の選択を棄却する個別文字検証手段とを更に備えることとしている。
このような構成によって、選択された候補文字を個別にルールと照合して、あり得ない候補文字を棄却するので、誤った文字認識を防止することができる。
また、類似度の高い2文字の形態特徴量と、2文字を識別するためのルールとを記載した類似候補文字識別辞書と、一の文字画像から選択された候補文字同士が類似候補文字識別辞書に登録されているとき、文字画像から形態特徴量を抽出し、前記ルールと照合し、2文字のうちいずれの文字を候補文字とするかを判定する候補文字判定手段とを更に備えることとしている。
このような構成によって、類似度の高い2文字のいずれに判定するのが候補文字としてより相応しいかが検証されるので文字認識の精度が向上する。
また、前記形態特徴量には、ループ位置又は数、所定範囲の平均線密度、凸端点位置又は数、凹端点位置又は数の少なくとも1つを含むこととしている。
このような構成によって、固有の特徴的な形態特徴量を用いて選択された候補文字を検証することによって、文字認識の精度を向上するとともに、少なくとも誤認識した候補文字を棄却することができる。
また、各文字の基準特徴量を登録した分類辞書を有し、文書画像の入力を受け、文書画像に含まれる各文字を認識する文字認識装置の文字認識方法であって、文書画像から文字画像を抽出する文字画像抽出ステップと、抽出された文字画像からその特徴量を抽出する特徴量抽出ステップと、抽出された特徴量と前記基準特徴量との類似度を計算し、類似度の高い文字を候補文字として選択する候補文字選択ステップと、前記特徴量抽出ステップで抽出された特徴量を用いて、同一文書内の文字画像同士の類似度を計算する類似度計算ステップと、 候補文字としての類似度と、前記文字画像同士の類似度とに基づいて、候補文字として認識の確かさを検証する認識検証ステップとを有することとしている。
このような方法によって、字形の変動の甚だしい手書き文字の場合でも、同一文書内の文字画像同士の類似度を反映させて認識結果が正しいか否かについて検証するので文書画像を正確に認識することができる。
また、各文字の基準特徴量を登録した分類辞書を有し、文書画像の入力を受け、文書画像に含まれる各文字を認識する文字認識装置に、文書画像から文字画像を抽出する文字画像抽出ステップと、抽出された文字画像からその特徴量を抽出する特徴量抽出ステップと、抽出された特徴量と前記基準特徴量との類似度を計算し、類似度の高い文字を候補文字として選択する候補文字選択ステップと、前記特徴量抽出ステップで抽出された特徴量を用いて、同一文書内の文字画像同士の類似度を計算する類似度計算ステップと、候補文字としての類似度と、前記文字画像同士の類似度とに基づいて、候補文字として認識の確かさを検証する認識検証ステップとを実行させるための文字認識プログラムとしている。
このような文字認識プログラムを文字認識装置に適用することによって、字形の変動の甚だしい手書き文字の場合でも、同一文書内の文字画像同士の類似度を反映させて認識結果が正しいか否かについて検証するので文書画像を正確に認識することができる。
また、文書画像の入力を受け、文書画像に含まれる各文字を認識する文字認識装置の集積回路であって、各文字の基準特徴量を登録した分類辞書と、文書画像から文字画像を抽出する文字画像抽出手段と、抽出された文字画像からその特徴量を抽出する特徴量抽出手段と、 抽出された特徴量と前記基準特徴量との類似度を計算し、類似度の高い文字を候補文字として選択する候補文字選択手段と、前記特徴量抽出手段で抽出された特徴量を用いて、同一文書内の文字画像同士の類似度を計算する類似度計算手段と、候補文字としての類似度と、前記文字画像同士の類似度とに基づいて、候補文字として認識の確かさを検証する認識検証手段とを備えることとしている。
このような集積回路を文字認識装置に用いることによって、字形の変動の甚だしい手書き文字の場合でも、同一文書内の文字画像同士の類似度を反映させて認識結果が正しいか否かについて検証するので文書画像を正確に認識することができる。
以下、本発明に係る文字認識装置の実施の形態について、図面を用いて説明する。
(一実施の形態)
図1は、本発明に係る文字認識装置の一実施の形態の構成図である。
この文字認識装置は、分類辞書101と、類似候補文字識別辞書102と、個別検証辞書103と、文書画像入力受付部104と、文字画像抽出部105と、特徴量抽出部106と、候補文字選択部107と、形態特徴量抽出部108と、候補文字判定部109と、個別文字検証部110と、類似度計算部111と、認識検証部112と、認識結果出力部113とを備えている。
分類辞書101は、磁気ディスク等からなり、図2に示すようなデータ構造を有する。図3にその一例を示すように、クラスタ番号301と識別子302と文字コード303と属性フラグ304と平均特徴305とからなる辞書データ306を多数登録している。図3は、その識別子302に示すように文字「中」を表すものである。なお、分類辞書101は、通常、1文字に対し字形の異なる複数の基準特徴量が含まれているマルチテンプレート辞書である。マルチテンプレート辞書の場合、候補文字にクラスタの異なる同一文字が複数個含まれる場合がある。
類似候補文字識別辞書102は、磁気ディスク等からなる。図4は、この類似候補文字識別辞書の一例を示すものである。類似候補文字識別辞書102には、類似文字組み合わせ402と特徴量403とルール404とが記載されている。類似文字組み合わせ402には、類似度の高い2文字が記載されている。
特徴量403には、この2文字を識別するための形態特徴量が記載されている。この形態特徴量には、ループ位置、ループ数、所定範囲の平均線密度、凸端点位置、凸端点数、凹端点位置、凹端点数等がある。
ルール404には、この形態特徴量を用いて、この2文字のいずれの文字に判定するかの判定基準が記載されている。
図5は、この類似候補文字識別辞書102に記載された類似文字組み合わせの「0‐6」、「4(閉型)‐9」、「8(斜型)‐9」の形態特徴量を説明するための図である。
図5(a)は、手書き文字「0」501と「6」502との形態特徴量と判定基準との関係を示している。手書き文字「0」501と「6」502との上部に引いた横線511、512が横切る線の数すなわち線密度は、それぞれ「2」と「1」であり、これを形態特徴量として、判定基準として「1.5」以上の場合に「0」に加点し、未満の場合に「6」に加点する。手書き文字「0」501と「6」502とは共にループが形成されている。このループの中央位置(図中×印で示す)について、文字の外接矩形の底辺からの高さ513、514を形態特徴量として、下寄りの場合には「6」に加点し、ほぼ中央の場合には「0」に加点する。なお、「0‐6」で形態特徴量として記載はされていないが、手書き文字「6」502には凹点515が形成されている。
図5(b)は、手書き文字「4」503と「9」504との形態特徴量と判定基準との関係を示している。手書き文字「4」503の右側中央部には右向きの凸端点521が形成されている。形態特徴量として凸端点521が存在すれば「4」に加点する判定基準が設けられている。
図5(c)は、手書き文字「8」505と「9」506との形態特徴量と判定基準との関係を示している。形態特徴量として下部平均線幅531、532が文字全体の線幅以下の場合「9」に加点し、それ以外の場合「8」に加点する判定基準が設けられている。また、形態特徴量として中央部左開き凹点533が存在すれば、「9」に加点する判定基準が設けられている。
以上の図5(a)〜(c)を用いて説明したような特徴量403とルール404とが多数の類似文字組み合わせ402について類似候補文字識別辞書102に記載されている。
個別検証辞書103は、磁気ディスク等からなる。図6は、この個別検証辞書103の一例を示す。個別検証辞書103は、文字602毎に肯定条件603、605、…、否定条件604、606、…とそれらのルール607とが記載されている。
図7は、個別検証辞書103の内容を説明するための図である。図7(a)には、手書き文字「0」701、702が示されている。手書き文字「0」701のループ中央位置は、文字外接矩形の中央部にある。また、ループ数は「1」であり、凸端点数は「0」であり、凹端点数は「0」である。また、中央領域711の平均線密度は「2」である。
手書き文字「0」702の中央領域712の平均線密度は「3」であり、凸端点数は「2」であり、凸端点位置が右上部713と左下部714とにある。
個別検証辞書103には、このような形態特徴量を肯定条件603の判定条件であるルール607に(1)、(2)として記載されている。また、個別検証辞書103の否定条件604には、手書き文字「0」701、702にはあり得ない形態特徴量が記載されている。例えば、否定条件604には、ループ数が「3」以上、中央領域の平均線密度が「4」以上等である。
図7(b)には、手書き文字「4」703、704が示されている。手書き文字「4」703には、ループ720が1つある。また、凸端点位置は右上部722、左中央部723、右中央部724、下部725に4凸端点ある。また、上部領域721の平均線密度は「2」である。下部領域731の平均線密度は「1」である。
個別検証辞書103の文字「4」の肯定条件605のルール607(1)には、ループ数が1であり、凸端点は、4凸端点中の3又は4凸端点が確認されれば判定条件を満たすこととされ、上部領域の平均線密度は1.5より大で、下部領域の平均線密度は1.5より小であると記載されている。
手書き文字「4」704には、ループは存在しない。凸端点位置は左上部726、右上部729、左中央部727、右中央部728、下部730に5凸端点ある。また、上部領域721の平均線密度は「2」である。下部領域731の平均線密度は「1」である。
個別検証辞書103の文字「4」の肯定条件605のルール607(2)には、ループ数が0であり、凸端点は、5凸端点中の4又は5凸端点が確認されれば判定条件を満たすこととされ、上部領域の平均線密度は1.5より大で、下部領域の平均線密度は1.5より小であると記載されている。
個別検証辞書103の否定条件606のルール607には、手書き文字「4」703、704にはあり得ない形態特徴量が記載されている。凸端点数が6以上、上部領域の平均線密度は3以上で、下部領域の平均線密度は2以上であると記載されている。
文書画像入力受付部104は、スキャナ等の光学読み取り装置からなり、ユーザから文書画像の入力を受付け、2値画像データに変換し、文書画像から文字行を切り出し、文字画像抽出部105に出力する。
文字画像抽出部105は、文書画像入力受付部104から入力された文字行から文字画像を抽出し、特徴量抽出部106、形態特徴量抽出部108および認証検証部112に出力する。
図8は、文字画像抽出部105によって、文書画像入力受付部104で受け付けられた文書画像801における1行目の文字列802の文字画像803〜806が抽出された状態を示している。
特徴量抽出部106は、各文字画像803〜806からそれぞれ特徴量を抽出し、候補文字選択部107および類似度計算部111に通知する。
候補文字選択部107は、通知された特徴量と分類辞書101の基準特徴量との類似度を計算し、類似度の高い順にN個の候補文字を選択する。ここで、類似度の計算には、例えば市街化距離やユークリッド距離が使われる。なお、この候補文字の選択については、上記した特許文献1に詳細に記載されている。
図9は、候補文字選択部107で選択された候補文字の一例を示す図である。ここでは、Nを10としている。ここで、クラスタ番号901は、上述したように、マルチテンプレート辞書を用いているので、同一文字に対して複数のクラスタが存在する。また、類似度902は、小数点以下第2位までの整数で示している。文字行802の文字画像803〜806は、それぞれ第1候補文字「中」、「内」、「里」、「穂」としての選択されている。
候補文字選択部107は、選択した候補文字を候補文字判定部109および認識検証部112に通知する。
形態特徴量抽出部108は、文字画像抽出部105から入力された文字画像を記憶領域に記憶しており、候補文字判定部109の指示に従い、文字画像から形態特徴量を抽出して、候補文字判定部109に通知する。同様に、個別文字検証部110から文字の肯定条件と否定条件とのルールの通知を受けると、対応する文字画像からルールに対応する形態特徴量を抽出して個別文字検証部110に通知する。
候補文字判定部109は、候補文字選択部107から通知された第1位から第N位の候補文字を組み合わせる。各候補文字の組み合わせが同一文字か否か(クラスタが異なるが同一文字であるか否か)を判定する。同一文字でなければ、類似候補文字識別辞書102の類似文字組み合わせ402に記載されているか否かを判定する。類似文字組み合わせ402に記載されているときには、その辞書データを読み出す。併せて、類似候補文字識別辞書102の特徴量403を形態特徴量抽出部108に通知し、候補文字の文字画像から形態特徴量を抽出するよう指示する。形態特徴量抽出部108から通知された形態特徴量と類似候補文字識別辞書102のルール404とを比較し、類似文字の何れが優位かを判定する。
例えば、図5(a)手書き文字「0」501の第1位候補文字が「6」であり、第2位候補文字が「0」である場合、ルール404に従えば、上部平均線密度が「2」であり、最大ループの中央位置がほぼ中央であるので、判定基準に従えば「0」に加点があり、優位となる。これによって、候補文字判定部109部は第1候補文字を「0」に、第2候補文字を「6」に変更する。候補文字判定部109は、この判定結果を個別文字検証部110に通知する。
個別文字検証部110は、候補文字判定部109から判定された候補文字の通知を受けると、個別検証辞書103の対応する文字602ごとに記載された肯定条件と否定条件とのルール607を読み出し、形態特徴量抽出部108に通知する。個別文字検証部110は、形態特徴量抽出部108から形態特徴量の通知を受けると、肯定条件と否定条件とのルールと形態特徴量とを比較し、肯定条件、否定条件がそれぞれ成立するか否かを判定する。個別文字検証部110は、第1位候補文字で否定条件が成立すると、第1位候補文字を「棄却」し、第1位候補文字で否定条件が不成立で、かつ肯定条件が成立すると第1位候補文字を「有効」として処理を終了する。第1位候補文字について、否定条件も肯定条件も成立しないときは、第2位候補文字について、個別検証辞書103の対応する文字の肯定条件と否定条件とのルール607を読み出し、形態特徴量抽出部108に通知する。形態特徴量抽出部108から形態特徴量の通知を受けると、肯定条件と否定条件とのルールと形態特徴量とを比較し、肯定条件、否定条件がそれぞれ成立するか否かを判定する。否定条件が成立せずに、肯定条件が成立したときには、第1位候補文字を「棄却」する。否定条件が成立し、または否定条件も肯定条件も成立しないときは、第3位以下の候補文字について同様の処理を行う。全ての候補文字について、否定条件も肯定条件も成立しないときには、第1位候補文字を有効と検証する。
なお、誤認識を極力防止する観点からは、全ての候補文字について、否定条件も肯定条件も成立しないときには、第1位候補文字を「棄却」としてもよい。
具体例を用いて説明すると、図7(b)の文字画像704の第1位候補文字が「4」である場合、個別文字検証部110は、個別検証辞書103の文字「4」の肯定条件と否定条件とのルールを読み出し、形態特徴量抽出部108に通知する。形態特徴量抽出部108では、記憶領域に記憶している文字画像704からループ数「0」と、凸端点数「5」と、上部領域の平均線密度「2」と、下部領域の平均線密度「1」とを抽出し、個別文字検証部110に通知する。個別文字検証部110は、ルール607の(2)のループ数0、凸端点数5、上部領域の平均線密度1.5以上、下部領域の平均線密度1.5以下に合致するので、肯定条件が成立すると判定し、凸端点数6以上、上部領域の平均線密度3以上、下部領域の平均線密度2以上との否定条件が成立しないと判定して、第1位候補文字「4」を「有効」と検証する。
なお、ルール607の(2)において、凸端点数を4又は5としたのは、形態特徴量抽出部108において全ての凸端点を抽出できない場合を考慮したものである。同様に、文字「4」の肯定条件の(1)においても凸端点を全て抽出できない場合を考慮して凸端点数を3又は4としている。
個別文字検証部110は、検証結果を認識検証部112に通知する。
類似度計算部111は、特徴量抽出部106から通知された文字画像の特徴量を記憶領域に記憶している。認識検証部112から検証対象とする候補文字の指定を受けると、対応する特徴量と同一行の候補文字の特徴量との類似度を計算する。計算した類似度を認識検証部112に通知する。なお、類似度の計算は、市街化距離等により計算され、0〜1の範囲に正規化される。この際、数値の大きな方が類似度が高いとされる。
認識検証部112は、文書画像の全体または同一行或いは帳票の同一フィールド等の一連の文字画像について、個別文字検証部110で検証された第1位候補文字を認識結果として採用すべきか否かを判定するため、各文字の位置、形状ならびに各文字相互の類似性に基づく文字間検証を行う。
認識検証部112は、文字画像抽出部105から入力された各文字画像を記憶領域に記憶しており、各文字画像の文字幅および文字高さを求め、平均文字幅および平均文字高さを計算し、それらの平均値から予め定めた閾値を超えた第1位候補文字およびそれらの平均値から予め定めた閾値以下の第1位候補文字を棄却する。
図10は、1行に記載された文字列画像1001を示している。ここで各文字画像C1011〜C1018について、平均文字幅1003より閾値を超えた文字幅を有する文字画像または平均文字高さ1004より閾値を超えた文字高さを有する文字画像があるか否かをみる。文字画像C1011は、平均文字幅1003より閾値を超えた文字幅を有し、平均文字高さ1004より閾値を超えた文字高さを有するので棄却する。また、文字画像C1017は、平均文字幅1003より閾値以下の文字幅を有し、平均文字高さ1004より閾値以下の文字高さを有するので棄却する。
また、認識検証部112は、平均文字位置1002(横書きの場合には垂直方向位置、縦書きの場合には水平方向位置)を求めておき、平均文字位置からずれの大きな文字画像を棄却する。例えば、文字画像C1018は、文字位置のずれが大きいので棄却する。
なお、平均文字幅1003より閾値以下の文字幅を有し、または平均文字高さ1004より閾値以下の文字高さを有する文字画像であっても、第1位候補文字が「。」、「‐」、「・」等の記号である場合には、その文字画像を棄却しないようにする。
また、「.」と「・」、「_」と「―」等文字位置により、同一字形文字を識別し、必要に応じて第1位候補文字の修正を行う位置処理を行う。
次に、認識検証部112は、各文字相互の類似性に基づく文字間検証を行う。
認識検証部112は、個別文字検証部110から第1位候補文字と「有効」で有るとの認識結果の通知を受けると、類似度計算部111に検証対象の候補文字を通知し、特徴量抽出部106から通知された1行の文字列の他の候補文字との類似度を計算するよう指示する。
特徴量抽出部106から類似度の計算結果を得ると、候補文字選択部107から通知された類似度との積を求める。
図11と図12とにその具体例を示して説明する。
図11は、1行に記載された文字列1101の文字画像C1111〜C1114を示している。これらの文字画像C1111〜C1114の候補文字選択部107および候補文字判定部109ならびに個別文字検証部110の選択、検証結果は、図12に示すように、第1位候補文字としてそれぞれ「4」、「6」、「5」、「6」である。これらの第1位候補文字として候補文字選択部107で選択されたときの分類辞書101の基準特徴量との類似度Rは、それぞれ「0.7」、「0.5」、「0.6」、「0.8」である。なお、個別文字検証部110での検証結果では、全て「有効」と検証されている。
今、文字画像C1112を検証対象の文字(C)とする。ここで文字画像C1112を検証対象の文字(C)としたのは、同一文字列1101の文字画像C1114が文字(C)と同一の候補文字「6」として選択されているからである。
類似度計算部111は、文字画像C1112と他の文字画像C1111、C1113、C1114との類似度rを計算する。この結果、他の文字画像C1111、C1113、C1114の類似度rはそれぞれ「0.1」、「0.75」、「0.3」となっている。
認証検証部112は、この類似度rが最大となっている文字画像C1113を文字(C1)とする。文字(C)と同一の候補文字として選択されている文字画像C1114を文字(C2)とをする。文字(C1)と文字(C2)との候補文字が同一であれば、検証対象の文字(C)の候補文字は有効とする。しかし、文字(C1)は、「5」であり、文字(C2)は、「6」である。
これらの文字(C1)、(C2)のr・Rの値は、それぞれ「0.45」、「0.24」と認証検証部112によって計算される。認証検証部112は、このr・Rの積がC1>C2であれば、検証対象の文字(C)の認識結果を文字(C1)の候補文字に変更する。また、C1<=C2であるときは、検証対象の文字(C)を棄却する。
今の場合、C1>C2であるので、文字画像C1112の候補文字「6」を文字(C1)の候補文字「5」に変更する。そして、検証結果を「有効」とする。
認識検証部112は、「有効」と判定された第1位候補文字を認識検証結果として、認識結果出力部113に通知する。なお、「棄却」と判定された第1位候補文字については、エラー通知をする。
認識結果出力部113は、認識検証部112から通知された第1位候補文字を認識結果として、例えば、ディスプレイに表示させ、または、外部装置に文字コードとして出力する。この際、エラー通知がなされた文字については、判読困難であったことを表示させる。
次に、上記の実施の形態の動作についてフローチャートを用いて説明する。
図13は、候補文字の選択までの動作を説明するフローチャートである。
先ず、文書画像入力受付部104は、ユーザからの文書画像の入力を受け付け、2値画像データに変換し(S1302)、文書画像から文字行を検出し、文字画像抽出部105に出力する(S1304)。文字画像抽出部105は、入力された文字行から文字画像を検出し(S1306)、形態特徴量抽出部108および認識検証部112の記憶領域に記憶させるとともに特徴量抽出部106に通知する(S1308)。
特徴量抽出部106は、文字画像から特徴量を抽出し、類似度計算部111に記憶させるとともに、候補文字選択部107に通知する(S1312)。
候補文字選択部107は、通知された特徴量と分類辞書101に登録されている基準特徴量との類似度を計算し、計算した類似度とその候補文字とを認識検証部112に記憶させるとともに(S1316)、類似度の高い順にN個の候補文字を選択する(S1318)。選択結果を候補文字判定部1092通知し(S1320)、1行中の全文字の処理が終了か否かを判定し(S1322)、終了でなければ、S1306に戻り、終了していれば、文書画像の全行について処理が終了したが否かを判定する(S1324)。終了していなければ、S1304に戻り、終了していれば、処理を終了する。
図14は、候補文字判定部109の動作を説明するフローチャートである。
候補文字判定部109は、候補文字選択部107から一の文字画像について第1位から第N位候補文字の通知を受けると、各候補文字の組み合わせが同一文字か否かを判定する(S1402)。同一文字であれば、S1414に移り、同一文字でなければ、類似候補文字識別辞書102の類似文字組み合わせにあるか否かを判定する(S1404)。なければS1414に移り、有るときは、その辞書データを読み出す(S1406)。
当該文字画像の形態特徴量を形態特徴量抽出部108に抽出させ(S1408)、抽出された形態特徴量と辞書データのルールとを照合し(S1410)、いずれの候補文字が優位かを判定する(S1412)。いずれが優位であるかを判定できないとき、S1414に移り、いずれかが優位であると判定したとき、優位と判定した候補文字を第1位候補文字として(S1416)、処理を終了する。
S1414において、別の候補文字の組み合わせがまだあるか否かを判定し、あれば、S1402に戻り、なければ処理を終了する。
以上の処理によって、候補文字選択部107で選択された一の文字画像に対するN個の候補文字について、類似度の高い2個の候補文字が類似候補文字識別辞書102に記載されているとき、その形態特徴量によって、いずれの候補文字がより文字画像に合致するかを判定するものである。
図15は、個別文字検証部の動作について説明するフローチャートである。
個別文字検証部110は、候補文字判定部109から一の文字画像についての第1位から第N位候補文字の通知を受けると、カウンタNを「1」に初期化する(S1502)。
次に、個別検証辞書103からの第N位候補文字のルールを読み出す(S1504)。形態特徴量抽出部108に文字画像からルールに記載された形態特徴量を抽出させる(S1506)。抽出された形態特徴量と個別検証辞書103の肯定・否定条件のルールと比較検証する(S1508)。カウンタNが1であるか否かを判定し(S1510)、1であれば、否定条件が成立するか否かを判定する(S1512)。成立すれば、第1位候補文字を「棄却」し(S1514)、処理を終了する。
否定条件が成立しないとき、肯定条件が成立するか否かを判定する(S1516)。成立するときは、第1位候補文字を「有効」とし(S1518)、処理を終了する。
肯定条件が成立しないとき、S1520に移る。S1520において、カウンタNに1を加える(S1520)。第N位候補文字があるか否かを判定し(S1522)、有るときはS1504に戻る。
S1510において、カウンタNが1でないとき、否定条件が成立するか否かを判定する(S1524)。成立するときはS1520に移り、成立しないときは、肯定条件が成立するか否かを判定する(S1526)。成立するときは、S1514に移る。成立しないときは、S1520に移る。
S1522において、N位候補文字がないときは、第1位候補文字を「有効」として(S1528)、処理を終了する。
なお、この実施の形態では、第1位候補文字が否定条件も肯定条件も成立しないとき、第2位以下の候補文字についても否定条件も肯定条件も成立しないときに、第1位候補文字を「有効」としたけれども「棄却」としてもよい。
次に、認識検証部112の動作を図16〜図18のフローチャートを用いて説明する。
先ず、認識検証部112は、文字画像抽出部105から入力されている文字画像について、平均文字幅・平均文字高さの算出を行い(S1602)、注目文字の文字幅・文字高さを算出して(S1604)、平均との差異を評価する(S1606)。文字サイズが所定の閾値を超えて大きいか否かを判定し(S1608)、大きいときには注目文字を棄却し(S1610)、S1616に移る。
文字サイズが所定の閾値を超えない場合には、さらに所定の閾値以下か否かを判定する(S1612)。以下の場合には、認識結果が「。」、「・」等の記号であるか否かを判定する(S1614)。否定のときにはS1610に移る。肯定のときにはS1616に移る。
S1616において全文字についての処理が終了したか否かを判定して、終了していれば処理をS1702に移り、終了していなければS1604に戻る。
S1702において、認識検証部112は、1行の文字列について平均文字位置を算出する。次に、文字サイズが小さいか否かを判定し(S1704)、小さくければ注目文字の平均文字位置からの変位を算出し(S1706)、その変位を評価する(S1708)。変位が大きいか否かを判定し(S1710)、大きければ注目文字を棄却して(S1712)、S1714に移る。変位が小さいときもS1714に移る。
文字サイズが小さいと判定したとき、位置処理を行い(S1718)、全文字の処理を終了したか否かを判定する(S1714)。終了していないときは、S1704に戻り、終了しているときはS1802に移る。
S1802において、認証検証部112は、同一文字列に第1位候補文字として同一文字として認識された文字画像があるときに、その文字画像を注目文字(C)としてその注目文字(C)の文字画像と他の文字画像との特徴量から類似度rを類似度計算部111に算出させる。このうち最も類似度の高い文字画像の候補文字を検出し、文字(C1)とする(S1804)。
注目文字(C)と同一の候補文字として選択された候補文字で類似度の最も高い候補文字を文字(C2)とする(S1806)。文字(C1)と文字(C2)とが同一か否かを判定する(S1808)。同一であるとき、文字(C1)が「棄却」されていたか否かを判定し(S1810)、否であれば文字(C)を「有効」とし(S1812)、S1820に移る。
S1808において、同一でないとき、文字(C1)は「有効」かつ、文字(C1)のr・R>文字(C2)のr・Rであるか否かを判定する(S1814)。肯定のときには、文字(C1)の認識結果(候補文字)を注目文字(C)の第1位候補文字に変更し(S1816)、S1820に移る。S1814において、否のとき、注目文字(C)の第1位候補文字を「棄却」し(S1818)、全文字についての処理が終了したか否かを判定する(S1820)。終了していれば処理を終了し、残っていればS1802に戻る。
なお、本実施の形態では、同一行の文字列の文字画像同士の類似度rを用いて第1位候補文字の認識の確かさを検証したけれども、同一の文書画像全体の文字画像同士の類似度rを用いて第1位候補文字の認識の確かさを検証してもよい。
また、本実施の形態では、同一行の文字画像中に同一候補文字として選択された候補文字が複数あるとき、そのうちの一の候補文字の文字画像を注目文字としたけれども、注目文字は、同一の文書画像全体の最初の文字から最後の文字まで順に注目文字とすることもできる。
さらに、候補文字の認識結果に印刷文字と手書き文字とが混在している場合または、候補文字の認識結果に英数字と漢字、ひらがな、カタカナとが混在している場合には、認識結果の属性によって、検証を行うことができる。
また、本実施の形態において、分類辞書101をマルチテンプレート辞書として説明したけれども、文字ごとに1つの基準特徴量を登録した単テンプレート辞書であってもよい。
また、本実施の形態において、候補文字選択部107においてN個の候補文字を選択するようにしたけれども、所定の類似度を設定し、所定の類似度よりも高い類似度を有する候補文字を選択するようにしてもよい。なお、この場合にも、少なくとも1の候補文字を選択するようにする。
また、本実施の形態において、認識検証部112は、個別文字検証部110で「有効」と判定された候補文字について認識検証したけれども、候補文字選択部107で選択された第1位候補文字について、直接文字画像同士の類似度rを用いて、他の第1位候補文字に変更処理をしてもよい。
また、本実施の形態において、個別文字検証部110は、候補文字判定部109の類似文字の判定結果を受けて、個別文字を検証したけれども、候補文字選択部107で選択された候補文字について、直接「有効」または「棄却」を検証してもよい。
(その他変形例)
なお、本発明は、上記実施の形態に限定されないのは勿論であり、以下のような変形例を実施することができる。
(1)上記文字認識装置を図1に示す構成図で示したけれども、具体的には、マイクロプロセッサ、ROM、RAM、ハードディスクユニット、ディスプレーユニット、キーボード、マウス、光学読み取り装置等から構成されるコンピュータシステムである。前記RAMまたはハードディスクユニットには、コンピュータプログラムが記録されている。このコンピュータプログラムは、上記構成図の各部の機能をコンピュータに発揮させるプログラムである。前記マイクロプロセッサが前記コンピュータプログラムに従って動作することにより各部の機能を達成する。ここで、コンピュータプログラムは、所定の機能を達成するために、コンピュータに対する指令を示す命令コードが複数個組み合わされて構成されたものである。
(2)上記文字認識装置を構成する構成要素の一部又は全部は、1個のシステムLSI(Large Scale Integration:大規模集積回路)から構成されているとしてもよい。システムLSIは、複数の構成部を1個のチップ上に集積して製造された超多機能LSIであり、具体的には、マイクロプロセッサ、ROM、RAMなどを含んで構成されるコンピュータシステムである。前記RAMには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムに従って動作することにより、システムLSIは、その機能を達成する。
(3)上記文字認識装置を構成する構成要素の一部又は全部は、装置に着脱可能なICカード又は単体のモジュールから構成されているとしてもよい。前記ICカードまたは前記モジュールは、マイクロプロセッサ、ROM、RAMなどから構成されるコンピュータシステムである。前記ICカード又は前記モジュールは、上記超多機能LSIを含むとしてもよい。マイクロプロセッサには、コンピュータプログラムに従って動作することにより、前記ICカード又は前記モジュールは、その機能を達成する。このICカード又はこのモジュールは、耐タンパ性を有するとしてもよい。
(4)本発明は、その動作を説明したように、文字認識装置の文字認識方法であるとしてもよい。またこの方法をコンピュータにより実現するコンピュータプログラムであるとしてもよいし、前記コンピュータプログラムからなるデジタル信号であるとしてもよい。
また、本発明は、前記コンピュータプログラム又は前記デジタル信号をコンピュータ読み取り可能な記録媒体、例えば、フレキシブルディスク、ハードディスク、CD‐ROM、MO、DVD、DVD‐ROM、DVD‐RAM、BD(Blu‐ray Disc)、半導体メモリなどに記録したものとしてもよい。また、これらの記録媒体に記録されている前記デジタル信号であるとしてもよい。
また、本発明は、前記コンピュータプログラムまたは前記デジタル信号を、電気通信回線、無線または有線通信回線、インターネットを代表とするネットワーク、データ放送等を経由して伝送するものとしてもよい。
また、本発明は、マイクロプロセッサとメモリを備えたコンピュータシステムであって、前記メモリは、上記コンピュータプログラムを記憶しており、前記マイクロプロセッサは、前記コンピュータプログラムに従って動作するとしてもよい。
また、前記プログラムまたは前記デジタル信号を前記記録媒体に記録して移送することにより、または前記プログラムまたは前記デジタル信号を前記ネットワーク等を経由して移送することにより、独立した他のコンピュータシステムにより実施するとしてもよい。
(5)上記実施の形態および上記変形例をそれぞれ組み合わせるとしてもよい。
本発明に係る文字認識装置は、画像読み取り装置を備えるパーソナルコンピュータの文字入力装置として利用され、多様な書体の文書や特に字形の変動の大きい手書き文字の入力装置として、例えば、帳票類からの文字入力装置として事務分野で活用される。
本発明に係る文字認識装置の一実施の形態の構成図である。 上記実施の形態の分類辞書のデータ構造を示す図である。 上記実施の形態の分類辞書の一例を示す図である。 上記実施の形態の類似候補文字識別辞書の一例を示す図である。 上記実施の形態の類似候補文字識別辞書の内容を説明するための図である。 上記実施の形態の個別検証辞書の一例を示す図である。 上記実施の形態の個別検証辞書の内容を説明するための図である。 上記実施の形態の文書画像入力受付部で受け付けられた文書画像の一例を示す図である。 上記実施の形態の候補文字選択部で選択された複数の候補文字の一例を示す図である。 上記実施の形態の認識検証部における棄却処理を説明するための図である。 上記実施の形態の認識検証部に通知された文字画像一例を示す図である。 上記実施の形態の認識検証部における処理内容を説明するための図である。 上記実施の形態の文書画像入力受付部、文字画像抽出部、特徴量抽出部および候補文字選択部の動作を説明するフローチャートである。 上記実施の形態の候補文字判定部の動作を説明するフローチャートである。 上記実施の形態の個別文字検証部の動作を説明するフローチャートである。 上記実施の形態の認識検証部の動作を説明するフローチャート(その1)である。 上記実施の形態の認識検証部の動作を説明するフローチャート(その2)である。 上記実施の形態の認識検証部の動作を説明するフローチャート(その3)である。
符号の説明
101 分類辞書
102 類似候補文字識別辞書
103 個別検証辞書
104 文書画像入力受付部
105 文字画像抽出部
106 特徴量抽出部
107 候補文字選択部
108 形態特徴量抽出部
109 候補文字判定部
110 個別文字検証部
111 類似度計算部
112 認識検証部
113 認識結果出力部

Claims (8)

  1. 文書画像の入力を受け、文書画像に含まれる各文字を認識する文字認識装置であって、
    各文字の基準特徴量を登録した分類辞書と、
    文書画像から文字画像を抽出する文字画像抽出手段と、
    抽出された文字画像からその特徴量を抽出する特徴量抽出手段と、
    抽出された特徴量と前記基準特徴量との類似度を計算し、類似度の高い文字を候補文字として選択する候補文字選択手段と、
    前記特徴量抽出手段で抽出された特徴量を用いて、同一文書内の文字画像同士の類似度を計算する類似度計算手段と、
    候補文字としての類似度と、前記文字画像同士の類似度とに基づいて、候補文字として認識の確かさを検証する認識検証手段とを備えることを特徴とする文字認識装置。
  2. 前記認識検証手段は、
    前記類似度計算手段で計算された検証対象文字との類似度rと、前記候補文字選択手段で計算された類似度Rとの積を計算する計算部と、
    前記候補文字選択手段で選択された同一候補文字についての積よりも大きな積を有する他の候補文字があるとき、前記検証対象文字の認識結果を前記他の候補文字に変更する認識結果変更部とを有することを特徴とする請求項1記載の文字認識装置。
  3. 文字ごとに候補文字として備えるべき形態特徴量を示した肯定条件と、候補文字として備えるべきでない形態特徴量を示した否定条件とをルールとして記載した個別検証辞書と、
    前記文字画像から形態特徴量を抽出し、選択された候補文字が肯定条件又は否定条件の何れに適合するかを判定し、否定条件に適合すると判定されたとき、その候補文字の選択を棄却する個別文字検証手段とを更に備えることを特徴とする請求項1記載の文字認識装置。
  4. 類似度の高い2文字の形態特徴量と、2文字を識別するためのルールとを記載した類似候補文字識別辞書と、
    一の文字画像から選択された候補文字同士が類似候補文字識別辞書に登録されているとき、文字画像から形態特徴量を抽出し、前記ルールと照合し、2文字のうちいずれの文字を候補文字とするかを判定する候補文字判定手段とを更に備えること特徴とする請求項1記載の文字認識装置。
  5. 前記形態特徴量には、ループ位置又は数、所定範囲の平均線密度、凸端点位置又は数、凹端点位置又は数の少なくとも1つを含むことを特徴とする請求項3又は4記載の文字認識装置。
  6. 各文字の基準特徴量を登録した分類辞書を有し、文書画像の入力を受け、文書画像に含まれる各文字を認識する文字認識装置の文字認識方法であって、
    文書画像から文字画像を抽出する文字画像抽出ステップと、
    抽出された文字画像からその特徴量を抽出する特徴量抽出ステップと、
    抽出された特徴量と前記基準特徴量との類似度を計算し、類似度の高い文字を候補文字として選択する候補文字選択ステップと、
    前記特徴量抽出ステップで抽出された特徴量を用いて、同一文書内の文字画像同士の類似度を計算する類似度計算ステップと、
    候補文字としての類似度と、前記文字画像同士の類似度とに基づいて、候補文字として認識の確かさを検証する認識検証ステップとを有することを特徴とする文字認識方法。
  7. 各文字の基準特徴量を登録した分類辞書を有し、文書画像の入力を受け、文書画像に含まれる各文字を認識する文字認識装置に、
    文書画像から文字画像を抽出する文字画像抽出ステップと、
    抽出された文字画像からその特徴量を抽出する特徴量抽出ステップと、
    抽出された特徴量と前記基準特徴量との類似度を計算し、類似度の高い文字を候補文字として選択する候補文字選択ステップと、
    前記特徴量抽出ステップで抽出された特徴量を用いて、同一文書内の文字画像同士の類似度を計算する類似度計算ステップと、
    候補文字としての類似度と、前記文字画像同士の類似度とに基づいて、候補文字として認識の確かさを検証する認識検証ステップとを実行させるための文字認識プログラム。
  8. 文書画像の入力を受け、文書画像に含まれる各文字を認識する文字認識装置の集積回路であって、
    各文字の基準特徴量を登録した分類辞書と、
    文書画像から文字画像を抽出する文字画像抽出手段と、
    抽出された文字画像からその特徴量を抽出する特徴量抽出手段と、
    抽出された特徴量と前記基準特徴量との類似度を計算し、類似度の高い文字を候補文字として選択する候補文字選択手段と、
    前記特徴量抽出手段で抽出された特徴量を用いて、同一文書内の文字画像同士の類似度を計算する類似度計算手段と、
    候補文字としての類似度と、前記文字画像同士の類似度とに基づいて、候補文字として認識の確かさを検証する認識検証手段とを備えることを特徴とする集積回路。

JP2006083726A 2005-10-12 2006-03-24 文字認識装置、その文字認識方法及び文字認識プログラムならびに集積回路 Expired - Fee Related JP4861730B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006083726A JP4861730B2 (ja) 2005-10-12 2006-03-24 文字認識装置、その文字認識方法及び文字認識プログラムならびに集積回路

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2005297830 2005-10-12
JP2005297830 2005-10-12
JP2006083726A JP4861730B2 (ja) 2005-10-12 2006-03-24 文字認識装置、その文字認識方法及び文字認識プログラムならびに集積回路

Publications (2)

Publication Number Publication Date
JP2007133850A true JP2007133850A (ja) 2007-05-31
JP4861730B2 JP4861730B2 (ja) 2012-01-25

Family

ID=38155423

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006083726A Expired - Fee Related JP4861730B2 (ja) 2005-10-12 2006-03-24 文字認識装置、その文字認識方法及び文字認識プログラムならびに集積回路

Country Status (1)

Country Link
JP (1) JP4861730B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010150916A1 (en) * 2009-06-24 2010-12-29 Sharp Kabushiki Kaisha Handwriting recognition method and device
JP2011076481A (ja) * 2009-09-30 2011-04-14 Fujitsu Ltd 検証装置、検証方法、検証プログラム及び作成装置
JP2015135580A (ja) * 2014-01-16 2015-07-27 富士通株式会社 手書き金額記入欄のチェック画面出力方法、手書き金額記入欄のチェック画面出力プログラム、および手書き金額記入欄のチェック画面出力装置
US10949699B2 (en) 2018-03-23 2021-03-16 Casio Computer Co., Ltd. Input apparatus having character recognition function for recognizing input handwriting, and input method and storage medium with program stored thereon having same

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06282680A (ja) * 1993-03-25 1994-10-07 Oki Electric Ind Co Ltd 文字認識処理装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06282680A (ja) * 1993-03-25 1994-10-07 Oki Electric Ind Co Ltd 文字認識処理装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010150916A1 (en) * 2009-06-24 2010-12-29 Sharp Kabushiki Kaisha Handwriting recognition method and device
CN101930545A (zh) * 2009-06-24 2010-12-29 夏普株式会社 手写识别方法和设备
JP2012520492A (ja) * 2009-06-24 2012-09-06 シャープ株式会社 手書き文字認識方法および手書き文字認識装置
JP2011076481A (ja) * 2009-09-30 2011-04-14 Fujitsu Ltd 検証装置、検証方法、検証プログラム及び作成装置
JP2015135580A (ja) * 2014-01-16 2015-07-27 富士通株式会社 手書き金額記入欄のチェック画面出力方法、手書き金額記入欄のチェック画面出力プログラム、および手書き金額記入欄のチェック画面出力装置
US10949699B2 (en) 2018-03-23 2021-03-16 Casio Computer Co., Ltd. Input apparatus having character recognition function for recognizing input handwriting, and input method and storage medium with program stored thereon having same

Also Published As

Publication number Publication date
JP4861730B2 (ja) 2012-01-25

Similar Documents

Publication Publication Date Title
JP4454789B2 (ja) 帳票分類方法及び装置
JP2734386B2 (ja) 文字列読み取り装置
US9224041B2 (en) Table of contents extraction based on textual similarity and formal aspects
US7852499B2 (en) Captions detector
JP2007233913A (ja) 画像処理装置及びプログラム
JP4861730B2 (ja) 文字認識装置、その文字認識方法及び文字認識プログラムならびに集積回路
JP2014067154A (ja) 文書分類支援装置、方法及びプログラム
JP4834351B2 (ja) 文字認識装置及び文字認識方法
JP2016027493A (ja) 文書分類支援装置、方法及びプログラム
JP5853531B2 (ja) 情報処理装置及び情報処理プログラム
JP3727422B2 (ja) 文字認識装置及びその方法
CN113157960A (zh) 相似数据获取的方法及装置、电子设备和计算机可读存储介质
JP2008193580A (ja) 情報処理装置
JP7421384B2 (ja) 情報処理装置、修正候補表示方法、及びプログラム
JP2851102B2 (ja) 文字切出し方法
JP2009223391A (ja) 画像処理装置及び画像処理プログラム
JPS6146573A (ja) 文字認識装置
JPH09265509A (ja) 合わせ読み住所認識方式
WO2023062799A1 (ja) 情報処理システム、原稿種識別方法、モデル生成方法及びプログラム
JP2728086B2 (ja) 文字切り出し方法
JPH055144B2 (ja)
JPH1011543A (ja) パターン認識用辞書作成装置及びパターン認識装置
JPH04309B2 (ja)
KR100206827B1 (ko) 문자 인식을 위한 한글/영문 판별방법
JPH05174185A (ja) 日本語文字認識装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090105

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110809

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110901

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111018

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111107

R150 Certificate of patent or registration of utility model

Ref document number: 4861730

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141111

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees