JP5672003B2 - 文字認識処理装置及びプログラム - Google Patents
文字認識処理装置及びプログラム Download PDFInfo
- Publication number
- JP5672003B2 JP5672003B2 JP2010293539A JP2010293539A JP5672003B2 JP 5672003 B2 JP5672003 B2 JP 5672003B2 JP 2010293539 A JP2010293539 A JP 2010293539A JP 2010293539 A JP2010293539 A JP 2010293539A JP 5672003 B2 JP5672003 B2 JP 5672003B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- recognition
- storage unit
- area
- data storage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Discrimination (AREA)
Description
(β)種類が「E」又は「e」であるSGが、状態が「X」であるSO及び当該SOよりも始点の値が小さいSOのいずれについてもアクセプトの条件を満たす場合、状態が「X」であるSOにはアクセプトされない。
(γ)状態が「SS」であるSOが、種類が「E」又は「e」であるSGについてアクセプトの条件を満たす場合、種類が「J」であるSGがアクセプトの条件を満たしているとしても、種類が「J」であるSGをアクセプトしない。
新たに生成されるSOの状態は、図13の表に示したルールに従い決定される。例えば1行目のデータは、状態が「Initial」であるSOは、種類が「J」であるSGをアクセプトすると新たに状態が「X」であるSOを生成し、種類が「e」であるSGをアクセプトすると新たに状態が「A」であるSOを生成し、種類が「E」であるSGをアクセプトすると新たに状態が「S」であるSOを生成することを表している。
新たに生成されるSOの始点は、アクセプトするSOの始点が「−1」であり且つアクセプトされるSGの種類が「E」又は「e」であるという始点条件が満たされた場合、「アクセプトされるSGの始点」であるとする。一方、始点条件が満たされない場合、新たに生成されるSOの始点は「アクセプトするSOの始点」であるとする。
新たに生成されるSOの終点は、新たに生成されるSOの状態が「End」ではないという終点条件が満たされた場合、「アクセプトされるSGの終点」であるとする。一方、終点条件が満たされない場合、新たに生成されるSOの終点は「アクセプトするSOの終点」であるとする。
次に、SG[11]がSOに入力されるが、SG[11]の種類は「対象外」なのでSOにアクセプトされることはない。
次に、SG[13]がSOに入力されるが、SG[13]の種類は「対象外」なのでSOにアクセプトされることはない。
英数字を含む日本語の文字列の画像データに対して第1の文字認識処理を行った場合に得られる文字の認識候補の各々について、当該認識候補と、前記画像データにおいて当該認識候補が占める文字領域の位置情報と、当該認識候補が前記第1の文字認識処理において最も確からしい認識結果であると認識された場合にはフラグとを格納する第1データ格納部と、
前記第1データ格納部に格納されているデータを用いて、連続する文字領域を含み且つ当該連続する文字領域の各々の認識候補が英数字である第1の領域であって、当該連続する文字領域の少なくとも一部の文字領域の認識候補に前記フラグが設定されている第1の領域を特定する探索部と、
特定された前記第1の文字領域の位置情報を算出し、第2データ格納部に格納する算出部と、
を有する文字認識処理装置。
前記第1データ格納部には、前記認識候補の各々について当該認識候補の確からしさを表す確度のデータがさらに格納されており、
前記第2データ格納部に格納されている前記第1の領域の位置情報を用いて、前記画像データにおける前記第1の領域に対して英数字の文字認識のための第2の文字認識処理を実行し、当該第2の文字認識処理により得られる認識候補の各々について、当該認識候補と、前記画像データにおける当該認識候補が占める文字領域の位置情報と、当該認識候補の確からしさを表す確度のデータとを第3データ格納部に格納する再認識処理部と、
前記確度の総和が最大になるように、前記第1及び第3データ格納部から認識候補を抽出し、抽出された当該認識候補を含む出力データを出力データ格納部に格納する決定部と、
をさらに有する付記1記載の文字認識処理装置。
前記第1の領域には認識候補が英数字であり且つ当該認識候補に前記フラグが設定されている文字領域が複数含まれ、当該複数の文字領域が隣接している
ことを特徴とする付記1又は2記載の文字認識処理装置。
前記第1の領域に含まれる文字領域についての認識候補は、当該文字領域についての複数の認識候補のうち最も確からしいと判定された認識候補である
ことを特徴とする付記1乃至3いずれか1つ記載の文字認識処理装置。
前記探索部が、
前記第1データ格納部に格納されている認識候補のうち、英数字であり且つ前記フラグが設定されている認識候補が占める第1の文字領域を特定し、
特定された前記第1の文字領域の所定の方向側に隣接する第2の文字領域について、認識候補が英数字であり且つ前記フラグが設定されているか判断し、認識候補が英数字であり且つ前記フラグが設定されていると判断された場合には、前記第1及び第2の文字領域を含む第3の文字領域を特定し、
特定された前記文字領域から所定の方向に連続する文字領域について、前記第3の文字領域に近い文字領域から順に認識候補が英数字であるか判断する判断処理を実行し、
前記判断処理を、認識候補が英数字ではないと判断された文字領域が出現するまで実行することにより、前記第1の領域を特定する
ことを特徴とする付記1乃至4いずれか1つ記載の文字認識処理装置。
英数字を含む日本語の文字列の画像データに対して第1の文字認識処理を行った場合に得られる文字の認識候補の各々について、当該認識候補と、前記画像データにおいて当該認識候補が占める文字領域の位置情報と、当該認識候補が前記第1の文字認識処理において最も確からしい認識結果であると認識された場合にはフラグとを格納する第1データ格納部に格納されているデータを用いて、連続する文字領域を含み且つ当該連続する文字領域の各々の認識候補が英数字である第1の領域であって、当該連続する文字領域の少なくとも一部の文字領域の認識候補に前記フラグが設定されている第1の領域を特定するステップと、
特定された前記第1の文字領域の位置情報を算出し、第2データ格納部に格納するステップと、
を、コンピュータに実行させるための文字認識処理プログラム。
前記第1データ格納部には、前記認識候補の各々について当該認識候補の確からしさを表す確度のデータがさらに格納されており、
前記第2データ格納部に格納されている前記第1の領域の位置情報を用いて、前記画像データにおける前記第1の領域に対して英数字の文字認識のための第2の文字認識処理を実行し、当該第2の文字認識処理により得られる認識候補の各々について、当該認識候補と、前記画像データにおける当該認識候補が占める文字領域の位置情報と、当該認識候補の確からしさを表す確度のデータとを第3データ格納部に格納するステップと、
前記確度の総和が最大になるように、前記第1及び第3データ格納部から認識候補を抽出し、抽出された当該認識候補を含む出力データを出力データ格納部に格納するステップと、
をさらに実行させるための付記6記載の文字認識処理プログラム。
前記第1の領域には認識候補が英数字であり且つ当該認識候補に前記フラグが設定されている文字領域が複数含まれ、当該複数の文字領域が隣接している
ことを特徴とする付記6又は7記載の文字認識処理プログラム。
前記第1の領域に含まれる文字領域についての認識候補は、当該文字領域についての複数の認識候補のうち最も確からしいと判定された認識候補である
ことを特徴とする付記6乃至8いずれか1つ記載の文字認識処理プログラム。
前記探索ステップが、
前記第1データ格納部に格納されている認識候補のうち、英数字であり且つ前記フラグが設定されている認識候補が占める第1の文字領域を特定するステップと、
特定された前記第1の文字領域の所定の方向側に隣接する第2の文字領域について、認識候補が英数字であり且つ前記フラグが設定されているか判断し、認識候補が英数字であり且つ前記フラグが設定されていると判断された場合には、前記第1及び第2の文字領域を含む第3の文字領域を特定するステップと、
特定された前記第3の文字領域から所定の方向に連続する文字領域について、前記第3の文字領域に近い文字領域から順に認識候補が英数字であるか判断する判断ステップと、
前記判断ステップの処理を、認識候補が英数字ではないと判断された文字領域が出現するまで実行することにより、前記第1の領域を特定するステップと、
を含む付記6乃至9いずれか1つ記載の文字認識処理プログラム。
12 全体認識処理部 13 全体認識結果格納部
14 領域抽出部 15 再認識処理部
16 再認識結果格納部 17 決定部
18 出力データ格納部 19 出力部
140 探索部 141 セグメント定義部
142 セグメントデータ格納部 143 座標データ格納部
144 領域探索部 1441 ステートオブジェクト管理部
1442 ステートオブジェクト 145 フィルタリング処理部
146 抽出結果格納部
Claims (5)
- 英数字を含む日本語の文字列の画像データに対する第1の文字認識処理において生成された複数の文字領域の各々について、当該文字領域を占める認識候補と、当該文字領域の開始位置の情報及び終了位置の情報と、当該文字領域を占める認識候補が前記第1の文字認識処理の結果として採用された場合にはフラグとを格納する第1データ格納部と、
前記第1データ格納部に格納されているデータを用いて、或る文字領域と、開始位置が当該或る文字領域の終了位置に最も近い文字領域とを特定する処理を繰り返すことで、連続する複数の文字領域を含む領域を1又は複数生成し、生成された1又は複数の前記領域のうち、前記連続する複数の文字領域の各々の認識候補が英数字であり且つ前記連続する複数の文字領域の少なくとも一部の文字領域の認識候補に前記フラグが設定されている第1の領域を特定する探索部と、
特定された前記第1の領域の位置情報を算出し、第2データ格納部に格納する算出部と、
を有する文字認識処理装置。 - 前記第1の文字認識処理において生成された複数の文字領域は、
前記第1の文字認識処理の結果として採用された認識候補が占める文字領域と、前記第1の文字認識処理の結果として採用されなかった認識候補が占める文字領域とを含む
請求項1記載の文字認識処理装置。 - 前記第1データ格納部は、前記複数の文字領域の各々について当該文字領域を占める認識候補の確からしさを表す確度のデータをさらに格納し、
前記第2データ格納部に格納されている前記第1の領域の位置情報を用いて、前記画像データにおける前記第1の領域に対して英数字の文字認識のための第2の文字認識処理を実行し、当該第2の文字認識処理により得られる認識候補の各々について、当該認識候補と、前記画像データにおける当該認識候補が占める文字領域の位置情報と、当該認識候補の確からしさを表す確度のデータとを第3データ格納部に格納する再認識処理部と、
前記確度の総和が最大になるように、前記第1及び第3データ格納部から認識候補を抽出し、抽出された当該認識候補を含む出力データを出力データ格納部に格納する決定部と、
をさらに有する請求項1又は2記載の文字認識処理装置。 - 前記第1データ格納部に格納されている前記認識候補の各々は、当該認識候補が占める文字領域についての複数の認識候補のうち最も確からしいと判定された認識候補である
ことを特徴とする請求項1乃至3いずれか1つ記載の文字認識処理装置。 - 英数字を含む日本語の文字列の画像データに対する第1の文字認識処理において生成された複数の文字領域の各々について、当該文字領域を占める認識候補と、当該文字領域の開始位置の情報及び終了位置の情報と、当該文字領域を占める認識候補が前記第1の文字認識処理の結果として採用された場合にはフラグとを格納する第1データ格納部に格納されているデータを用いて、或る文字領域と、開始位置が当該或る文字領域の終了位置に最も近い文字領域とを特定する処理を繰り返すことで、連続する複数の文字領域を含む領域を1又は複数生成し、生成された1又は複数の前記領域のうち、前記連続する複数の文字領域の各々の認識候補が英数字であり且つ前記連続する複数の文字領域の少なくとも一部の文字領域の認識候補に前記フラグが設定されている第1の領域を特定するステップと、
特定された前記第1の領域の位置情報を算出し、第2データ格納部に格納するステップと、
を、コンピュータに実行させるための文字認識処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010293539A JP5672003B2 (ja) | 2010-12-28 | 2010-12-28 | 文字認識処理装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010293539A JP5672003B2 (ja) | 2010-12-28 | 2010-12-28 | 文字認識処理装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012141750A JP2012141750A (ja) | 2012-07-26 |
JP5672003B2 true JP5672003B2 (ja) | 2015-02-18 |
Family
ID=46677998
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010293539A Active JP5672003B2 (ja) | 2010-12-28 | 2010-12-28 | 文字認識処理装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5672003B2 (ja) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2671533B2 (ja) * | 1989-12-21 | 1997-10-29 | 日本電気株式会社 | 文字列認識方法及びその装置 |
US6047251A (en) * | 1997-09-15 | 2000-04-04 | Caere Corporation | Automatic language identification system for multilingual optical character recognition |
JP3919617B2 (ja) * | 2002-07-09 | 2007-05-30 | キヤノン株式会社 | 文字認識装置および文字認識方法、プログラムおよび記憶媒体 |
JP4759963B2 (ja) * | 2004-09-22 | 2011-08-31 | 沖電気工業株式会社 | 複数の認識辞書を利用した文字認識装置 |
-
2010
- 2010-12-28 JP JP2010293539A patent/JP5672003B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012141750A (ja) | 2012-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5716328B2 (ja) | 情報処理装置、情報処理方法、および情報処理プログラム | |
JP5071914B2 (ja) | 認識グラフ | |
US5943443A (en) | Method and apparatus for image based document processing | |
US6047251A (en) | Automatic language identification system for multilingual optical character recognition | |
JP2734386B2 (ja) | 文字列読み取り装置 | |
US9836646B2 (en) | Method for identifying a character in a digital image | |
US9711117B2 (en) | Method and apparatus for recognising music symbols | |
WO2018125926A1 (en) | Robust string text detection for industrial optical character recognition | |
US7162086B2 (en) | Character recognition apparatus and method | |
JP3452774B2 (ja) | 文字認識方法 | |
Hussain et al. | Nastalique segmentation-based approach for Urdu OCR | |
CN111340020A (zh) | 一种公式识别方法、装置、设备及存储介质 | |
US8750571B2 (en) | Methods of object search and recognition | |
Inkeaw et al. | Recognition-based character segmentation for multi-level writing style | |
EP2138959B1 (en) | Word recognizing method and word recognizing program | |
Ghaleb et al. | Segmentation of offline handwritten Arabic text | |
US11551461B2 (en) | Text classification | |
Nguyen et al. | A segmentation method of single-and multiple-touching characters in offline handwritten japanese text recognition | |
JP5672003B2 (ja) | 文字認識処理装置及びプログラム | |
JP2012098905A (ja) | 文字認識装置、文字認識方法及びプログラム | |
JP4087191B2 (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
US9224040B2 (en) | Method for object recognition and describing structure of graphical objects | |
JP2002063197A (ja) | 検索装置、記録媒体およびプログラム | |
KR100919497B1 (ko) | 이미지에 포함되는 한글 문자를 인식하기 위하여 자소분할하는 방법 및 컴퓨터 판독 가능한 기록 매체 | |
US20120201420A1 (en) | Object Recognition and Describing Structure of Graphical Objects |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20131007 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140523 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140617 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140723 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141125 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141208 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5672003 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |