JP5344956B2 - 文字認識方法および文字認識装置 - Google Patents
文字認識方法および文字認識装置 Download PDFInfo
- Publication number
- JP5344956B2 JP5344956B2 JP2009047291A JP2009047291A JP5344956B2 JP 5344956 B2 JP5344956 B2 JP 5344956B2 JP 2009047291 A JP2009047291 A JP 2009047291A JP 2009047291 A JP2009047291 A JP 2009047291A JP 5344956 B2 JP5344956 B2 JP 5344956B2
- Authority
- JP
- Japan
- Prior art keywords
- boundary line
- probability
- character
- correct reading
- misreading
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Discrimination (AREA)
Description
また、本発明は、上記の発明において、前記サンプル値記憶工程は、前記サンプル値に対して、正しい読みや、スキャナによる文字データを追加して記憶することを特徴とする。
特に、正読確率領域として形状が楕円である正読確率楕円を生成するとともに、誤読確率領域として形状が楕円である誤読確率楕円を生成することとしたので、幾何的な計算を行いやすい確率楕円を、境界線を決定するための指標として利用することによって、境界線の決定を容易に行うことができるという効果を奏する。また、正読確率楕円と誤読確率楕円との中間点を通過するとともに第2の軸と平行な直線である第1の境界線と、中間点および正読確率楕円の重心を第1の軸へ射影した点を通過する直線である第2の境界線とを決定し、第1の境界線以下であり、かつ、第2の境界線以上である2次元空間に含まれる文字認識結果を正読として受け付けると判定することとしたので、簡単な処理で境界線を決定することができるとともに、文字認識精度を向上させることができるという効果を奏する。
11 スキャナ
12 キーボード
13 ディスプレイ
14 制御部
14a 文字認識部
14b 認識結果確定部
14c 認識結果登録部
14d 閾値変更判定部
14e 確率領域生成部
14f 境界線決定部
15 記憶部
15a テンプレート情報
15b サンプル情報
15c 閾値情報
Claims (9)
- 光学的に読み取った文字データを各文字に対応した文字テンプレートとそれぞれ対比することで文字認識を行う文字認識方法であって、
前記文字データと前記文字テンプレートとの違いをあらわす距離値をそれぞれ算出したうえで、前記距離値が最も小さい前記文字テンプレートを1位候補とするとともに、前記距離値が2番目に小さい前記文字テンプレートを2位候補とした場合に、前記文字データと前記1位候補との前記距離値をあらわす1位候補距離値と、前記文字データと前記2位候補との前記距離値から前記1位候補距離値を差し引いた距離差とを算出する距離算出工程と、
同一文字種の各文字データについての前記1位候補距離値および前記距離差を正読または誤読の別と対応付けてサンプル値として記憶するサンプル値記憶工程と、
前記サンプル値記憶工程によって記憶された前記サンプル値を、前記1位候補距離値を第1の軸、前記距離差を第2の軸とする2次元空間に配置したうえで、正読のサンプル値の分布について所定の正読率をあらわす形状が楕円である正読確率楕円からなる閉領域の正読確率領域と、誤読のサンプル値の分布について所定の誤読率をあらわす形状が楕円である誤読確率楕円からなる閉領域の誤読確率領域とを生成する確率領域生成工程と、
前記確率領域生成工程によって生成された前記正読確率領域および前記誤読確率領域の位置関係に基づいて前記文字データに対する文字認識結果を正読とするか否かの判定に用いる境界線を決定する境界線決定工程と、
前記文字認識結果に対応する前記1位候補距離値および前記距離差の組を前記境界線決定工程で決定された前記境界線と対比することで当該文字認識結果を正読として受け付けるか否かを判定する判定工程と
を含み、
前記境界線決定工程は、
前記正読確率楕円と前記誤読確率楕円との中間点を通過するとともに前記第2の軸と平行な直線である第1の境界線と、前記中間点および前記正読確率楕円の重心を前記第1の軸へ射影した点を通過する直線である第2の境界線とを決定し、
前記判定工程は、
前記第1の境界線以下であり、かつ、前記第2の境界線以上である前記2次元空間に含まれる前記文字認識結果を正読として受け付けると判定する
ことを特徴とする文字認識方法。 - 前記境界線決定工程は、
前記正読確率楕円と前記誤読確率楕円とが交差して前記中間点が存在しない場合に、前記中間点を通過する代わりに前記正読確率楕円または前記誤読確率楕円に接するように前記第1の境界線および前記第2の境界線を決定することを特徴とする請求項1に記載の文字認識方法。 - 前記確率領域生成工程は、
複数の前記正読率について前記正読確率楕円をそれぞれ生成するとともに、複数の前記誤読率について前記誤読確率楕円をそれぞれ生成し、
前記境界線決定工程は、
複数の前記正読確率楕円のうち1つと複数の前記誤読確率楕円のうち1つとを用いて前記境界線を決定することを特徴とする請求項1または2に記載の文字認識方法。 - 前記正読確率楕円と前記誤読確率楕円とが交差して前記中間点が存在しない場合に、前記第1の境界線および前記第2の境界線について、前記中間点を通過させる代わりに複数の前記正読確率楕円または複数の前記誤読確率楕円のうちいずれの接線とするかを利用者に選択させる選択工程と、
前記選択工程における選択によって決定された前記第1の境界線および前記第2の境界線と前記サンプル値の分布とを含んだ分布図と、当該分布図における前記第1の境界線および前記第2の境界線によって正読であるにも関わらずリジェクトされた前記サンプル値の割合をあらわす正読リジェクト率および/または誤読を誤読として正当にリジェクトされた前記サンプル値の割合をあらわす誤読リジェクト率を示すリジェクト率グラフとを表示する表示工程と
をさらに含んだことを特徴とする請求項1に記載の文字認識方法。 - 前記境界線決定工程は、
前記第1の境界線を複数の前記正読確率楕円または複数の前記誤読確率楕円のうちいずれの接線とするかをあらわす第1の接線候補と、前記第2の境界線を複数の前記正読確率楕円または複数の前記誤読確率楕円のうちいずれの接線とするかをあらわす第2の接線候補との各組合せについて、前記正読リジェクト率が所定の許容上限値以下であり、かつ、前記誤読リジェクト率が所定の許容下限値以上である前記組合せを抽出し、
前記表示工程は、
前記境界線決定工程によって抽出された前記組合せを前記リジェクト率グラフに含めて表示することを特徴とする請求項4に記載の文字認識方法。 - 前記境界線決定工程は、
複数の前記組合せが抽出された場合に、前記各組合せについて予め定められた優先度に基づいて1つの前記組合せを決定し、当該組合せに対応する前記第1の境界線および前記第2の境界線を決定することを特徴とする請求項5に記載の文字認識方法。 - 前記境界線決定工程は、
前記サンプル値記憶工程によって記憶された前記サンプル値の個数が所定の基準値を超えるたびに、前記境界線を再決定することを特徴とする請求項1〜6のいずれか一つに記載の文字認識方法。 - 前記サンプル値記憶工程は、前記サンプル値に対して、正しい読みや、スキャナによる文字データを追加して記憶することを特徴とする請求項1〜7のいずれか一つに記載の文字認識方法。
- 光学的に読み取った文字データを各文字に対応した文字テンプレートとそれぞれ対比することで文字認識を行う文字認識装置であって、
前記文字データと前記文字テンプレートとの違いをあらわす距離値をそれぞれ算出したうえで、前記距離値が最も小さい前記文字テンプレートを1位候補とするとともに、前記距離値が2番目に小さい前記文字テンプレートを2位候補とした場合に、前記文字データと前記1位候補との前記距離値をあらわす1位候補距離値と、前記文字データと前記2位候補との前記距離値から前記1位候補距離値を差し引いた距離差とを算出する距離算出手段と、
同一文字種の各文字データについての前記1位候補距離値および前記距離差を正読または誤読の別と対応付けてサンプル値として記憶するサンプル値記憶手段と、
前記サンプル値記憶手段によって記憶された前記サンプル値を、前記1位候補距離値を第1の軸、前記距離差を第2の軸とする2次元空間に配置したうえで、正読のサンプル値の分布について所定の正読率をあらわす形状が楕円である正読確率楕円からなる閉領域の正読確率領域と、誤読のサンプル値の分布について所定の誤読率をあらわす形状が楕円である誤読確率楕円からなる閉領域の誤読確率領域とを生成する確率領域生成手段と、
前記確率領域生成手段によって生成された前記正読確率領域および前記誤読確率領域の位置関係に基づいて前記文字データに対する文字認識結果を正読とするか否かの判定に用いる境界線を決定する境界線決定手段と、
前記文字認識結果に対応する前記1位候補距離値および前記距離差の組を前記境界線決定手段で決定された前記境界線と対比することで当該文字認識結果を正読として受け付けるか否かを判定する判定手段と
を備え、
前記境界線決定手段は、
前記正読確率楕円と前記誤読確率楕円との中間点を通過するとともに前記第2の軸と平行な直線である第1の境界線と、前記中間点および前記正読確率楕円の重心を前記第1の軸へ射影した点を通過する直線である第2の境界線とを決定し、
前記判定手段は、
前記第1の境界線以下であり、かつ、前記第2の境界線以上である前記2次元空間に含まれる前記文字認識結果を正読として受け付けると判定する
ことを特徴とする文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009047291A JP5344956B2 (ja) | 2009-02-27 | 2009-02-27 | 文字認識方法および文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009047291A JP5344956B2 (ja) | 2009-02-27 | 2009-02-27 | 文字認識方法および文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010204766A JP2010204766A (ja) | 2010-09-16 |
JP5344956B2 true JP5344956B2 (ja) | 2013-11-20 |
Family
ID=42966211
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009047291A Expired - Fee Related JP5344956B2 (ja) | 2009-02-27 | 2009-02-27 | 文字認識方法および文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5344956B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020136778A1 (ja) * | 2018-12-26 | 2020-07-02 | ファーストアカウンティング株式会社 | 書類分類システム、書類分類装置、書類分類方法、書類分類プログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS638884A (ja) * | 1986-06-30 | 1988-01-14 | Toshiba Corp | 文字読取装置 |
JPH03188586A (ja) * | 1989-12-18 | 1991-08-16 | Nippon Telegr & Teleph Corp <Ntt> | パターン認識検定処理方式 |
JPH09128487A (ja) * | 1995-10-27 | 1997-05-16 | Mitsubishi Heavy Ind Ltd | パタン認識装置 |
JPH09153113A (ja) * | 1995-11-30 | 1997-06-10 | Toshiba Corp | 文字認識方法および文字認識装置 |
-
2009
- 2009-02-27 JP JP2009047291A patent/JP5344956B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010204766A (ja) | 2010-09-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110069767B (zh) | 基于电子书的排版方法、电子设备及计算机存储介质 | |
KR101811581B1 (ko) | 문서 이미지에서 표 인식을 위한 장치 및 방법 | |
US4903312A (en) | Character recognition with variable subdivisions of a character region | |
US10885325B2 (en) | Information processing apparatus, control method, and storage medium | |
JP6900164B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP6078953B2 (ja) | 文字認識方法、およびこの方法を用いた文字認識装置およびプログラム | |
EP0779593A2 (en) | Image processing method and apparatus and memory medium | |
CN111310634B (zh) | 证件类型识别模板的生成方法、证件识别方法及装置 | |
WO2013121647A1 (ja) | 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム | |
JP7039882B2 (ja) | 画像解析装置及び画像解析プログラム | |
JP5344956B2 (ja) | 文字認識方法および文字認識装置 | |
JP6116531B2 (ja) | 画像処理装置 | |
KR20160053544A (ko) | 후보 문자의 추출 방법 | |
JP7338159B2 (ja) | 情報処理装置及びプログラム | |
JP4628278B2 (ja) | 表認識装置、及びコンピュータプログラム | |
JP4087191B2 (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
JP2018142066A (ja) | 文字認識装置、文字認識方法、文字認識プログラム、及び文字認識プログラムを記録したコンピューター読み取り可能な記録媒体 | |
JP2007272769A (ja) | 指紋照合装置、指紋照合方法 | |
JP2006023798A (ja) | 画像データ処理装置および方法,ならびに画像データ処理プログラム | |
JP2728086B2 (ja) | 文字切り出し方法 | |
JP2010039615A (ja) | 文字認識方法及び文字認識装置 | |
JP2009272714A (ja) | 画像処理装置、画像処理方法、プログラム及びプログラムを記録した記録媒体 | |
JP2001092921A (ja) | 文字行領域抽出方法と文字行領域検出に用いられる学習方法 | |
JP2013114678A (ja) | 画像判定装置およびプログラム | |
JP6489041B2 (ja) | 情報処理装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111227 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130424 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130507 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130628 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130723 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130813 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |