JP3595081B2 - 文字認識方法 - Google Patents
文字認識方法 Download PDFInfo
- Publication number
- JP3595081B2 JP3595081B2 JP27089096A JP27089096A JP3595081B2 JP 3595081 B2 JP3595081 B2 JP 3595081B2 JP 27089096 A JP27089096 A JP 27089096A JP 27089096 A JP27089096 A JP 27089096A JP 3595081 B2 JP3595081 B2 JP 3595081B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- size
- rectangle
- candidate
- reference character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Landscapes
- Character Discrimination (AREA)
Description
【発明の属する技術分野】
本発明は、日本語または英語を認識する文字認識方法において、類似した文字を高精度に識別する文字認識方法に関する。
【0002】
【従来の技術】
本出願人は先に、類似文字を識別する際、基準文字サイズの面積に対する、対象文字の面積の比(面積比)を特徴量として高精度に判定を行う文字認識方法を提案した(特開平3−147084号公報を参照)。また、誤認識しやすい特定の文字について、類似文字を識別する際に、個々の文字の高さと幅の比(縦横比)を用いて高精度に判定を行う類似文字識別方法を提案した(特開平4−98383号公報を参照)。
【0003】
上記した類似文字識別方法を改良したものとして、複数の認識結果候補から候補数を絞り込む際に、認識結果候補文字の縦横比および面積比と、文字辞書の縦横比および面積比とを比較し、その比較結果が所定の閾値を超える認識結果候補を、複数の候補から削除する文字認識方法を提案した(特開平4−372089号公報を参照)。また、切り出された個々の文字を縦横比によって判断するとき、基準となる文字矩形の縦横比に対する、対象文字の縦横比(相対縦横比)を算出し、文字辞書に格納された値と比較することによって判定を行う文字認識方法も提案した(特願平6−304523号)。
【0004】
【発明が解決しようとする課題】
上記したように、文字認識が対象とする文書の文字列イメージから基準文字サイズを求める場合、文字列内には漢字、ひらがな、カタカナ、英字、数字、記号など多種類の文字が混在していて、またそれらは文字種毎に、文字毎に文字矩形サイが異なっている。図11の第1行の文字列では、「行」が最大文字矩形であり、第2行の文字列では「な」が最大文字矩形、第3行では「E」が最大文字矩形である。
【0005】
従来の技術では、行内の文字矩形の内、最も大きなサイズを基準として設定していた。1行の基準文字サイズとしては、行内に存在する文字種に左右されない安定した値を得ることが望ましいが、従来は文字種毎の文字矩形サイズの変化を考慮していない。例えば、英字のみの行では、図11に示すように、最大文字サイスが小さく、漢字を含む行に比べて小さい基準文字サイスが設定されていた。このため、基準文字サイズの変動により、類似文字識別の閾値が変動し、認識の精度が低下するという問題がある。
【0006】
本発明の目的は、文字種毎に基準文字サイズを決めることにより、類似文字を高精度に識別する文字認識方法を提供することにある。
【0007】
【課題を解決するための手段】
前記目的を達成するために、請求項1記載の発明では、認識対象となる文字列画像から文字矩形を切り出し、該文字矩形から基準文字サイズを決定し、該基準文字サイズを基に前記各文字を認識する文字認識方法において、前記基準文字サイズを決定する際に、前記各文字矩形の文字種類を判定し、該文字種類毎に文字矩形サイズを補正した基準文字サイズ候補を作成し、該基準文字サイズ候補集合の最大値または平均値を基に基準文字サイズを決定することを特徴としている。
【0008】
請求項2記載の発明では、認識対象となる文字列画像から文字矩形を切り出し、該文字矩形から基準文字サイズを決定し、該基準文字サイズを基に前記各文字を認識する文字認識方法において、前記基準文字サイズを決定する際に、前記各文字矩形の文字コードを判定し、該文字コードに応じて文字矩形サイズを補正した基準文字サイズ候補を作成し、該基準文字サイズ候補集合の最大値または平均値を基に基準文字サイズを決定することを特徴としている。
【0009】
請求項3記載の発明では、類似文字を識別するために、前記基準文字サイズに対する各類似文字サイズのパラメータを特徴量とする辞書を備えたことを特徴としている。
【0010】
請求項4記載の発明では、前記文字種判定の確度が低い文字矩形については、基準文字サイズ候補の作成から外すことを特徴としている。
【0011】
請求項5記載の発明では、前記文字コード判定の確度が低い文字矩形については、基準文字サイズ候補の作成から外すことを特徴としている。
【0012】
請求項6記載の発明では、前記文字種類毎に行う文字矩形サイズの補正は、漢字文字矩形サイズを1.0倍して基準文字サイズ候補を作成し、ひらがな文字矩形サイズを1.1倍して基準文字サイズ候補を作成し、カタカナ文字矩形サイズを1.1倍して基準文字サイズ候補を作成し、英字文字矩形サイズを1.6倍して基準文字サイズ候補を作成し、数字文字矩形サイズを1.6倍して基準文字サイズ候補を作成し、1行分の基準文字サイズ候補の集合の内、最大値をとる基準文字サイズ候補を基準文字サイズと決定することを特徴としている。
【0013】
請求項7記載の発明では、前記基準文字サイズ候補集合の中に、漢字文字種の基準文字サイズ候補があるとき、漢字文字種の基準文字サイズ候補集合から基準文字サイズを決定し、漢字文字種の候補がない場合は、ひらがな文字種の基準文字サイズ候補集合を探索し、ひらがな文字種の集合がない場合は、次にカタカナ文字種を探索し、以下、文字種が見つかるまで、数字文字種、次いで、英字文字種を探索し、確度の高い文字矩形サイズ情報を優先的に利用して基準文字サイズを決定することを特徴としている。
【0014】
【発明の実施の形態】
以下、本発明の一実施例を図面を用いて具体的に説明する。
〈実施例1〉
図1は、本発明の実施例1の構成を示す。文字切り出し部1は、画像メモリ5に格納された文字列を含むイメージから文字矩形を切り出し、その結果を文字切り出しデータメモリ6に書き込む。文字種判定部2は、文字切り出しデータメモリ6、文字辞書メモリ7などの内容を参照して、各文字の文字種を判定し、その結果を結果メモリ8に書き込む。基準文字サイズ決定部3は、文字切り出しデータメモリ6、結果メモリ8の内容を参照して、文字列の基準文字サイズを決定し、その結果を結果メモリ8に書き込む。類似文字判定部4は、文字切り出しデータメモリ6、文字辞書メモリ7、結果メモリ8の内容を参照して、各文字の文字コードを判定し、その結果を結果メモリ8に書き込む。
【0015】
図2は、本発明の実施例1の処理フローチャートである。以下、具体例を用いて実施例を説明する。図3は、文字列の例を示す。対象文字列「リロピー100cx」がイメージとして入力されると、文字切り出し部1は、それぞれの文字矩形を切り出す(ステップ101)。図4は、切り出された文字矩形を示す。文字種判定部2は、切り出された文字矩形のそれぞれについて、文字辞書メモリ7との照合によって、文字種類の候補群を得る(ステップ102)。この際、文字辞書メモリ7との照合において、文字サイズを考慮しない特徴量を用いて比較を行い、サイズのみが異なるような文字、例えば「C」と「c」は両方の候補が得られるようにする。
【0016】
図5は、文字候補の結果を示す。サイズを考慮しないで照合を行っているので、「○」と「0」、「C」と「c」、「X」と「x」が候補になっている。
【0017】
基準文字サイズ決定部3は、各文字の第1文字候補を考慮して、基準文字サイズ候補を決定する(ステップ103)。第1文字矩形は「リ」が得られているので、文字種は「カタカナ」を想定する。カタカナについては、面積の補正値は1.1倍とする。つまり、実際の文字矩形の面積は27×40=1080であるが、これを1.1倍して、1080×1.1=1188を基準文字サイズ候補とする。
【0018】
以下同様にして、順次基準文字サイズ候補を算出するが、第4矩形「ー」については、サイズの大きく異なる文字(「・」など)と誤認している可能性があるので、この文字矩形サイズからは基準文字サイズ候補を生成しない。文字矩形番号5、6、7についても同様の理由で基準文字サイズ候補を生成しない。矩形番号8、9については、大文字、小文字の相違があるものの、候補は英字のみで、英字の補正を行う場合に問題がないので、基準文字サイズ候補を生成する。
【0019】
図6は、生成された基準文字サイズ候補を示す。図6では、5個の基準文字サイズ候補(番号、1、2、3、8、9)が得られている。これらのうち、最大値を基準サイズとするが、文字種の優先度を考慮して、漢字→ひらがな・カタカナ→数字・英字の順番に基準文字サイスを探す。この例では、漢字、ひらがなの基準文字サイズはなく、カタカナ「リ」、「ロ」、「ピ」の3つが最初に検索され、これらの内、最大である「ピ」の基準文字サイズ候補1386を基準サイズとする。
【0020】
類似文字判定部4は、基準文字サイズに対する面積比で類似文字の識別を判定する(ステップ104)。例えば矩形番号8の「c」を識別する場合を説明すると、基準文字サイズ(面積)1386に対して、「c」の矩形面積は598であるので、面積比は598/1386=0.43となる。矩形番号8の候補「C」、「c」について、文字辞書メモリ7の面積比パラメータが、図7に示すように構成されていると、面積比0.43に近い方の候補が上位となって、第1候補が「c」、第2候補が「C」となり、候補の入れ替えが行われる。上記したと同様に全ての文字矩形の認識処理を行うことによって、正しい文字候補が得られる。
【0021】
もし、本発明が適用されない場合は、文字列の最大文字矩形面積1260が基準文字サイズとなり、これに対する面積比が求められることになる。このときの面積比は0.47となるので、第1候補は「C」となり、誤った結果が得られる。図8は、本発明が適用されない場合の誤った文字候補例を示す。なお、基準文字サイズを決定する際に、基準文字サイズ候補の集合の平均値から決定してもよい。
【0022】
〈実施例2〉
図9は、本発明の実施例2の構成を示し、実施例1の文字種判定部を文字コード判定部9に置き換えて構成されている。図10は、実施例2の処理フローチャートである。本実施例では、実施例1と同じ状況において、ステップ202の文字コードの判定結果から基準文字サイズ候補を得る際に、各文字毎に実施例1とは異なる補正値を適用して、基準文字サイズを決定する(ステップ203)。
【0023】
例えば、カタカナ「リ」については、幅が狭い矩形であるので、面積を1.2倍して基準文字サイズ候補を得る。つまり、(27×40)×1.2=1296。カタカナ「ロ」については、幅も高さも小さめなので、1.3倍する。(32×33)×1.3=1372。カタカナ「ピ」は、比較的大きな文字なので、1.1倍して(36×35)×1.1=1386。このようにすることによって、「リ」、「ロ」、「ピ」それぞれから得られる基準文字サイズ候補は、実施例1に比べて、よりきめ細かく正確な値を得ることができる。以降の処理は実施例1と同様なので説明を省略する。
【0024】
〈実施例3〉
上記した実施例1、2は基準文字サイズの面積比を用いて類似文字を識別する実施例であるが、本実施例では、先の従来技術で提案されている「相対縦横比」を用いて類似文字を識別する(実施例3の構成は実施例1または2と同様である)。すなわち、文字列の基準文字幅、基準文字高さを決定する際に、実施例1、2で基準文字サイズ(面積)を補正したと同様に、文字種または文字コードによって、文字幅、文字高さをそれぞれ独立に補正して基準候補を求めるこにより、より正確な基準値を得ることができる。つまり、より正確に類似文字を識別することができる。
【0025】
【発明の効果】
以上、説明したように、本発明によれば、文字種類を考慮して、文字種類毎に文字矩形サイズを補正した基準文字サイズ候補を作成し、該候補集合の最大値または平均値を基に基準文字サイズを決定しているので、識別が難しい類似文字を高精度に認識することができる。
【図面の簡単な説明】
【図1】本発明の実施例1の構成を示す。
【図2】実施例1の処理フローチャートである。
【図3】文字列の例を示す。
【図4】切り出された文字矩形を示す。
【図5】文字候補の結果を示す。
【図6】生成された基準文字サイズ候補を示す。
【図7】文字辞書メモリの面積比パラメータ例を示す。
【図8】本発明が適用されない場合の誤った文字候補例を示す。
【図9】本発明の実施例2の構成を示す。
【図10】実施例2の処理フローチャートである。
【図11】種々の文字矩形サイズを示す。
【符号の説明】
1 文字切り出し部
2 文字種判定部
3 基準文字サイズ決定部
4 類似文字判定部
5 画像メモリ
6 文字切り出しデータメモリ
7 文字辞書メモリ
8 結果メモリ
9 文字コード判定部
Claims (7)
- 認識対象となる文字列画像から文字矩形を切り出し、該文字矩形から基準文字サイズを決定し、該基準文字サイズを基に前記各文字を認識する文字認識方法において、前記基準文字サイズを決定する際に、前記各文字矩形の文字種類を判定し、該文字種類毎に文字矩形サイズを補正した基準文字サイズ候補を作成し、該基準文字サイズ候補集合の最大値または平均値を基に基準文字サイズを決定することを特徴とする文字認識方法。
- 認識対象となる文字列画像から文字矩形を切り出し、該文字矩形から基準文字サイズを決定し、該基準文字サイズを基に前記各文字を認識する文字認識方法において、前記基準文字サイズを決定する際に、前記各文字矩形の文字コードを判定し、該文字コードに応じて文字矩形サイズを補正した基準文字サイズ候補を作成し、該基準文字サイズ候補集合の最大値または平均値を基に基準文字サイズを決定することを特徴とする文字認識方法。
- 類似文字を識別するために、前記基準文字サイズに対する各類似文字サイズのパラメータを特徴量とする辞書を備えたことを特徴とする請求項1または2記載の文字認識方法。
- 前記文字種判定の確度が低い文字矩形については、基準文字サイズ候補の作成から外すことを特徴とする請求項1記載の文字認識方法。
- 前記文字コード判定の確度が低い文字矩形については、基準文字サイズ候補の作成から外すことを特徴とする請求項2記載の文字認識方法。
- 前記文字種類毎に行う文字矩形サイズの補正は、漢字文字矩形サイズを1.0倍して基準文字サイズ候補を作成し、ひらがな文字矩形サイズを1.1倍して基準文字サイズ候補を作成し、カタカナ文字矩形サイズを1.1倍して基準文字サイズ候補を作成し、英字文字矩形サイズを1.6倍して基準文字サイズ候補を作成し、数字文字矩形サイズを1.6倍して基準文字サイズ候補を作成し、1行分の基準文字サイズ候補の集合の内、最大値をとる基準文字サイズ候補を基準文字サイズと決定することを特徴とする請求項1記載の文字認識方法。
- 前記基準文字サイズ候補集合の中に、漢字文字種の基準文字サイズ候補があるとき、漢字文字種の基準文字サイズ候補集合から基準文字サイズを決定し、漢字文字種の候補がない場合は、ひらがな文字種の基準文字サイズ候補集合を探索し、ひらがな文字種の集合がない場合は、次にカタカナ文字種を探索し、以下、文字種が見つかるまで、数字文字種、次いで、英字文字種を探索し、確度の高い文字矩形サイズ情報を優先的に利用して基準文字サイズを決定することを特徴とする請求項1または2記載の文字認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP27089096A JP3595081B2 (ja) | 1996-02-15 | 1996-10-14 | 文字認識方法 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2817296 | 1996-02-15 | ||
JP8-178258 | 1996-07-08 | ||
JP8-28172 | 1996-07-08 | ||
JP17825896 | 1996-07-08 | ||
JP27089096A JP3595081B2 (ja) | 1996-02-15 | 1996-10-14 | 文字認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH1078998A JPH1078998A (ja) | 1998-03-24 |
JP3595081B2 true JP3595081B2 (ja) | 2004-12-02 |
Family
ID=27286101
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP27089096A Expired - Lifetime JP3595081B2 (ja) | 1996-02-15 | 1996-10-14 | 文字認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3595081B2 (ja) |
-
1996
- 1996-10-14 JP JP27089096A patent/JP3595081B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH1078998A (ja) | 1998-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6944344B2 (en) | Document search and retrieval apparatus, recording medium and program | |
US7162086B2 (en) | Character recognition apparatus and method | |
JP3452774B2 (ja) | 文字認識方法 | |
US5956433A (en) | Method and device for removing spots from a character image in an optical character reader | |
JP3595081B2 (ja) | 文字認識方法 | |
JP2001236467A (ja) | パターン認識方法、装置、およびパターン認識プログラムを記録した記録媒体 | |
JP2639314B2 (ja) | 文字認識方式 | |
JPH10162103A (ja) | 文字認識装置 | |
JP3151866B2 (ja) | 英文字認識方法 | |
JPH06119497A (ja) | 文字認識方法 | |
JP2922949B2 (ja) | 文字認識の後処理方法 | |
CN116311264A (zh) | 一种基于字符轮廓的字符识别方法 | |
JPS6330991A (ja) | 文字認識装置 | |
JPH11120294A (ja) | 文字認識装置および媒体 | |
JP2000207491A (ja) | 文字列読取方法及び装置 | |
JPH0436885A (ja) | 光学式文字読取装置 | |
JPH04289989A (ja) | 英文字認識装置 | |
JPH0210480A (ja) | 文字判別方法 | |
JPS6081688A (ja) | 情報認識方式 | |
JP2001188881A (ja) | 文字認識装置 | |
JPH1069518A (ja) | 文字認識方法およびその装置 | |
JPH04315278A (ja) | 文字認識装置 | |
JPH0728944A (ja) | 英文字認識装置 | |
JPH07152877A (ja) | 英文字認識装置 | |
JPH02132577A (ja) | 文字認識結果の修正方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040609 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040831 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040902 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080910 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080910 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090910 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090910 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100910 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110910 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120910 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130910 Year of fee payment: 9 |
|
EXPY | Cancellation because of completion of term |