JP2004038736A - 文字認識処理方法、文字認識処理装置、文字認識プログラム - Google Patents
文字認識処理方法、文字認識処理装置、文字認識プログラム Download PDFInfo
- Publication number
- JP2004038736A JP2004038736A JP2002197100A JP2002197100A JP2004038736A JP 2004038736 A JP2004038736 A JP 2004038736A JP 2002197100 A JP2002197100 A JP 2002197100A JP 2002197100 A JP2002197100 A JP 2002197100A JP 2004038736 A JP2004038736 A JP 2004038736A
- Authority
- JP
- Japan
- Prior art keywords
- character
- character recognition
- reference value
- word
- recognition result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
【解決手段】上記課題を解決するために、本発明では、イメージデータに含まれる複数の文字画像の文字認識を行い、各文字画像の文字認識結果を出力し、前記文字認識結果の文字列に含まれる文字種を判別し、前記判別した文字種に応じて、基準値を設定し、前記文字認識結果の文字列と単語辞書とを照合し、その照合結果と前記設定された基準値とを比較することにより、前記文字認識結果の文字列の単語候補を前記単語辞書から選択する。
【選択図】 図3
Description
【発明の属する技術分野】
本発明は、スキャナ等を介して入力された画像に記載されている文字画像を文字認識した結果の文字列に対し、単語辞書を用いて単語照合を行うことにより認識精度を高めることが可能な文字認識処理方法、文字認識処理装置、文字認識プログラムに関するものである。
【0002】
【従来の技術】
従来、手書き文字や印刷文字などが記載された帳票などの文書を、スキャナ等を介して光学的に読み取って得たイメージデータに対して光学的文字認識(OCR)処理を行うことにより、文字画像を文字コードにする文字認識処理装置が知られている。
【0003】
このような文字認識処理では、パターンマッチング方式や構造解析方式などの認識アルゴリズムを用いて文字を認識しているが、認識精度には限界があり、誤認識が生じうる。特に、手書き文字などのようにノイズや文字のばらつきが大きい場合は、誤認識が発生しやすくなる。
【0004】
そこで、文字認識した結果に対して、熟語や住所・人名などが記載された単語辞書を用いて、単語辞書中の単語と認識結果文字列中の単語とを照合して、誤認識を訂正することにより認識精度を向上させるようにしている。
【0005】
【発明が解決しようとする課題】
しかしながら、従来の単語照合では、単語辞書中の単語と認識結果文字列中の単語とを照合して、字種にかかわらず所定の基準値以上一致しているかどうかで、単語辞書中の単語を訂正候補にするかどうか判断していた。しかしながら、文字の種類が少ない文字種で構成される単語では、単語辞書に格納された複数の単語と所定の基準値以上一致する確率が高くなるため、複数の単語が候補として残り、意図した単語以外の単語が候補として多く残ってしまう場合があった。
【0006】
本発明は、単語照合を行う際の認識精度を更に向上させるものである。
【0007】
【課題を解決するための手段】
上記課題を解決するために、本発明の文字認識処理方法は、イメージデータに含まれる複数の文字画像の文字認識を行い、各文字画像の文字認識結果を出力する文字認識ステップと、前記文字認識結果の文字列に含まれる文字種を判別する文字種判別ステップと、前記文字種判別ステップで判別した文字種に応じて、基準値を設定する基準値設定ステップと、前記文字認識結果の文字列と単語辞書とを照合し、その照合結果と前記基準値設定ステップで設定された基準値とを比較することにより、前記文字認識結果の文字列の単語候補を前記単語辞書から選択する選択ステップとを有する。
【0008】
上記課題を解決するために、本発明の文字認識処理装置は、イメージデータに含まれる複数の文字画像の文字認識を行い、各文字画像の文字認識結果を出力する文字認識手段と、前記文字認識結果の文字列に含まれる文字種を判別する文字種判別手段と、前記文字種判別手段で判別した文字種に応じて、基準値を設定する基準値設定手段と、前記文字認識結果の文字列と単語辞書とを照合し、その照合結果と前記基準値設定手段で設定された基準値とを比較することにより、前記文字認識結果の文字列の単語候補を前記単語辞書から選択する選択手段とを有する。
【0009】
【発明の実施の形態】
<装置の説明>
図1は、本発明の実施形態に係る文字認識処理装置の基本構成を示すブロック図である。
【0010】
11は、帳票等の文書をイメージデータとして入力するスキャナなどの画像入力手段である。なお、画像入力手段11はスキャナではなく、カメラ、あるいはファイル読み込み装置などであっても構わない。12はプロセッサであり、メモリ15に格納された制御プログラム15cを実行することにより、文字認識手段12a、文字種判別手段12b、基準値設定手段12c、単語候補決定手段12dとして機能する。文字認識手段は、入力された文字画像に対して文字認識処理を行い、文字コードデータを出力する。その際、一般に正確な文字認識は困難であるため、各文字画像について複数の文字候補を得る。13は、キーボードであり、ユーザの操作に応じて、実行指示、取消指示などの指示操作を行う。14は、補助記憶装置として機能するディスクであり、フロッピー(R)ディスクやCD−ROMなどを用いることができる。15は、プロセッサ12において後述するフローチャートのような処理を実行するための制御プログラムを記憶したり、該制御プログラムを実行する際のワークエリアとして使用したり、単語辞書や画像入力手段11で読み込んだイメージデータを蓄積するメモリである。16は、認識結果等の各種情報を出力するディスプレイ、プリンタなどの出力手段である。これらの構成要素がバス17を介して相互に接続されている。なお、本実施形態では、後述するフローチャートのような処理を実行するための制御プログラムをメモリ15に格納しておくとしたが、この制御プログラムはネットワークを介して配信されるものであっても良いし、CD−ROM等を用いて読み込まれるものであっても良い。
【0011】
図3は、本発明に係る文字認識処理装置における処理手順の一例を示すフローチャートである。
【0012】
まず、ステップS31で、スキャナ等により読み取ったイメージデータを文字認識して、文字コードに変換する。この文字認識処理では、例えば、図2(a)のような文字画像を文字認識処理した結果、図2(b)のような認識結果候補が得られたものとする。通常、1つの文字に対して複数の文字認識候補が得られる。(図2(b)では、例えば、文字画像「エ」に対し、文字認識結果の候補として「エ」「ユ」「セ」「モ」が得られたことを示している。)
ステップS32で、文字認識候補の文字種を判別する。文字種の判別は、文字認識結果候補の文字コードから判断するようにしてもよいし、また、予め、入力位置により漢字、かな等の入力データの文字種がわかるようにしていて、判断するようにしてもよい。
【0013】
次に、ステップS33で、文字種ごとに決めた基準値を設定する。該基準値はその文字種に属する文字の種類の数に応じて定めておくものとし、文字の種類が少ない文字種については基準値が高くなるように設定しておく。図2は、文字種がカタカナと漢字の場合だが、カタカナと漢字では、文字の種類はカタカナの方が漢字より少ないので、カタカナの基準値の方が漢字の基準値より高く設定される。つまり、文字の種類はカタカナの方が少ないので、単語辞書内の単語と一致する確率が高くなるためである。この基準値は単語辞書や読み取った文字画像の種類に応じて実験的に求められる値であるが、例として、本実施形態では、漢字の基準値を30%、カタカナの基準値を60%と設定する。
【0014】
そして、ステップS34で、文字認識結果の単語と単語辞書に格納されている単語の1つと照合を行う。ステップS35で、この照合の結果、該単語内で一致している文字の割合が基準値以上かを判断する。基準値より下の場合は、ステップS37に進む。ここで、基準値以上の場合は、ステップS36に進み、その単語を候補として残す。
【0015】
そして、ステップS37で、辞書内の単語が他にあるかチェックする。他にある場合は、ステップS34に戻って、次の辞書単語との照合をおこなう。他にないときは、ステップS38に進み、単語候補として残ったものをランク付けして結果を出力する。一致している割合が高い単語候補から順に上位のランクとして出力する。また、一致している割合が同じ単語候補同士のときは、文字認識候補の順位の高い文字を含む単語候補から順に出力する。
【0016】
仮に単語辞書に「江戸川区」「エドガワク」「世田谷区」「セタガヤク」が登録されているとする。まず、カタカナの文字画像を照合した場合、単語辞書の「エドガワク」が文字認識結果の候補文字に含まれているかを照合すると「エ」「ド」「ガ」「ク」の4文字が含まれている。全文字数が5文字なので、80%一致していることになる。これは、基準値60%以上であるので「エドガワク」を単語候補として残す。次に単語辞書の「セタガヤク」と照合した場合、文字認識結果候補には「ガ」「ク」の2文字が含まれているので、40%の一致度であり、基準値以下であるので「セタガヤク」は単語候補として残さない。一方、漢字の文字画像は、「江戸川区」と照合すると、文字認識木結果候補には「江」「川」の2文字が含まれているので50%一致していることになり、基準値30%以上となり、単語候補として残す。が、辞書単語「世田谷区」はどれも一致していないため、0%となり、基準値以下となり、単語候補として残らない。
【0017】
もし、基準値をカタカナも漢字も同じ値30%にしていると、カタカナは、辞書単語「エドガワク」と80%、辞書単語「セタガヤク」と40%一致しているので、両方とも基準値以上となり、「エドガワク」、「セタガヤク」の2候補が単語候補として残ってしまうことになり、誤認識の原因となりうる。したがって、本願のように文字種に応じて基準値を変えた場合、基準値を文字種に関わらず一定の値にしている場合に比べて、より良い結果を得やすくなる。
【0018】
【発明の効果】
以上説明したように、本発明によれば、認識精度を更に向上させることが可能になる。
【図面の簡単な説明】
【図1】本発明の実施形態に係る文字認識処理装置の基本構成を示すブロック図である。
【図2】文字認識結果の一例を示す図である。
【図3】本発明に係る文字認識処理における処理手順の一例を示すフローチャートである。
Claims (7)
- イメージデータに含まれる複数の文字画像の文字認識を行い、各文字画像の文字認識結果を出力する文字認識ステップと、
前記文字認識結果の文字列に含まれる文字種を判別する文字種判別ステップと、
前記文字種判別ステップで判別した文字種に応じて、基準値を設定する基準値設定ステップと、
前記文字認識結果の文字列と単語辞書とを照合し、その照合結果と前記基準値設定ステップで設定された基準値とを比較することにより、前記文字認識結果の文字列の単語候補を前記単語辞書から選択する選択ステップと
を有することを特徴とする文字認識処理方法。 - 前記基準値は、前記文字種に属する文字の種類が少ない方が高く設定されることを特徴とする請求項1に記載の文字認識処理方法。
- 前記文字認識ステップでは、該文字画像ごとに複数の認識候補を前記文字認識結果として出力することを特徴とする請求項1に記載の文字認識処理方法。
- 更に、前記選択ステップで選択された単語候補にランク付けを行うランク付けステップを有することを特徴とする請求項1に記載の文字認識処理方法。
- 請求項1乃至4のいずれかに記載の文字認識処理方法の各ステップをコンピュータに実行させるためのコンピュータ実行可能な文字認識プログラム。
- 請求項5に記載の文字認識プログラムを格納したコンピュータ読み取り可能な記憶媒体。
- イメージデータに含まれる複数の文字画像の文字認識を行い、各文字画像の文字認識結果を出力する文字認識手段と、
前記文字認識結果の文字列に含まれる文字種を判別する文字種判別手段と、
前記文字種判別手段で判別した文字種に応じて、基準値を設定する基準値設定手段と、
前記文字認識結果の文字列と単語辞書とを照合し、その照合結果と前記基準値設定手段で設定された基準値とを比較することにより、前記文字認識結果の文字列の単語候補を前記単語辞書から選択する選択手段と
を有することを特徴とする文字認識処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002197100A JP4261831B2 (ja) | 2002-07-05 | 2002-07-05 | 文字認識処理方法、文字認識処理装置、文字認識プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002197100A JP4261831B2 (ja) | 2002-07-05 | 2002-07-05 | 文字認識処理方法、文字認識処理装置、文字認識プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004038736A true JP2004038736A (ja) | 2004-02-05 |
JP4261831B2 JP4261831B2 (ja) | 2009-04-30 |
Family
ID=31704958
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002197100A Expired - Fee Related JP4261831B2 (ja) | 2002-07-05 | 2002-07-05 | 文字認識処理方法、文字認識処理装置、文字認識プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4261831B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060227139A1 (en) * | 2005-04-07 | 2006-10-12 | Nintendo Co., Ltd. | Storage medium storing game program and game apparatus therefor |
-
2002
- 2002-07-05 JP JP2002197100A patent/JP4261831B2/ja not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060227139A1 (en) * | 2005-04-07 | 2006-10-12 | Nintendo Co., Ltd. | Storage medium storing game program and game apparatus therefor |
US8558792B2 (en) * | 2005-04-07 | 2013-10-15 | Nintendo Co., Ltd. | Storage medium storing game program and game apparatus therefor |
Also Published As
Publication number | Publication date |
---|---|
JP4261831B2 (ja) | 2009-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4366108B2 (ja) | 文書検索装置、文書検索方法及びコンピュータプログラム | |
RU2613846C2 (ru) | Метод и система извлечения данных из изображений слабоструктурированных документов | |
US10963717B1 (en) | Auto-correction of pattern defined strings | |
JP4750476B2 (ja) | 文書検索装置及び方法と記憶媒体 | |
US8750571B2 (en) | Methods of object search and recognition | |
US8208685B2 (en) | Word recognition method and word recognition program | |
US6035062A (en) | Character recognition method and apparatus | |
US11797551B2 (en) | Document retrieval apparatus, document retrieval system, document retrieval program, and document retrieval method | |
JP2009223556A (ja) | 文字認識プログラム、文字認識電子部品、文字認識装置、文字認識方法、およびデータ構造 | |
JP4261831B2 (ja) | 文字認識処理方法、文字認識処理装置、文字認識プログラム | |
US7016535B2 (en) | Pattern identification apparatus, pattern identification method, and pattern identification program | |
Chowdhury et al. | Implementation of an optical character reader (ocr) for bengali language | |
JP2020047031A (ja) | 文書検索装置、文書検索システム及びプログラム | |
JP2007018158A (ja) | 文字処理装置、文字処理方法及び記録媒体 | |
JP2020123925A (ja) | 情報処理装置及びプログラム | |
JP7268316B2 (ja) | 情報処理装置及びプログラム | |
JP7421384B2 (ja) | 情報処理装置、修正候補表示方法、及びプログラム | |
US11574490B2 (en) | Information processing apparatus and non-transitory computer readable medium storing information processing program | |
US11868726B2 (en) | Named-entity extraction apparatus, method, and non-transitory computer readable storage medium | |
JP3985926B2 (ja) | 文字認識方法、文字認識装置、文書画像処理システム及び記録媒体 | |
JP2006163830A (ja) | 文字認識装置、文字認識方法、および文字認識プログラム | |
JP4633271B2 (ja) | 辞書学習方法及び辞書学習プログラム | |
JPH09138835A (ja) | 文字認識装置 | |
JPH1069494A (ja) | 画像検索方法とその装置 | |
JP2004258950A (ja) | 文字認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050610 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080918 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080924 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081125 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090203 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090206 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120220 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4261831 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130220 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140220 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |