JP5041775B2 - 文字切出方法及び文字認識装置 - Google Patents
文字切出方法及び文字認識装置 Download PDFInfo
- Publication number
- JP5041775B2 JP5041775B2 JP2006264710A JP2006264710A JP5041775B2 JP 5041775 B2 JP5041775 B2 JP 5041775B2 JP 2006264710 A JP2006264710 A JP 2006264710A JP 2006264710 A JP2006264710 A JP 2006264710A JP 5041775 B2 JP5041775 B2 JP 5041775B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- pattern
- rectangle
- characters
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
((白画素数合計)×255 )/(セル内全画素数) ・・・式(1)
また、手書き文字の場合、文字矩形のパターンのばらつきが多くなるため、文字矩形内の黒で重心を算出し、重心部分を前記分割させたセルの中央に位置させて正規化を行い、上記式(1)によって算出することも可能である。
341 文字コード
Claims (12)
- (a)全角文字又は幅の広い文字及び半角文字又は幅の細い文字を含む文字パターンから成る文字列の画像から各文字パターンを1文字単位で切り出す文字切出方法であって、
(b)誤って結合する文字又は文字の一部を連続した状態で切り出した誤結合パターン、及び、1文字で他の文字とは結合しない文字の文字パターンを辞書データとして登録し、該辞書データに前記誤結合パターンに対応する分割位置の情報を登録し、射影によって検出された文字矩形を結合した状態で前記辞書データとパターンマッチングを行い、マッチングした文字矩形を前記分割位置の情報に基づいて分割し、文字パターンを切り出すことを特徴とする文字切出方法。 - 前記誤って結合する文字又は文字の一部は、半角文字、幅の狭い文字、又は、全角文字若しくは横方向に分離している文字の一部である請求項1に記載の文字切出方法。
- (a)接触文字又は隣り合う文字と結合している文字を含む文字パターンから成る文字列の画像から各文字パターンを1文字単位で切り出す文字切出方法であって、
(b)入り組み又は接触によって複数文字が射影上1文字の文字矩形として検出される誤結合パターン及び該誤結合パターンに対応する分割位置の情報を登録した辞書データと射影によって検出された文字矩形を結合した状態でパターンマッチングを行い、マッチングした文字矩形を前記分割位置の情報に基づいて分割し、文字パターンを切り出すことを特徴とする文字切出方法。 - 複数の文字矩形を結合して1文字となる文字パターンを辞書データとして登録し、射影によって検出された隣り合う文字矩形を結合した状態で登録した辞書データとパターンマッチングを行い、マッチングした文字矩形を他の文字矩形と結合させて文字パターンを切り出す請求項1又は3に記載の文字切出方法。
- 前記辞書データに、隣り合う文字の文字矩形が進入しないように分割情報の間隔を空けて登録するとともに、文字が入り組んだ情報を登録し、前記辞書データに基づいて文字パターンを切り出すことにより、文字矩形に隣接の文字矩形が進入しないようにする請求項1〜4のいずれか1項に記載の文字切出方法。
- (a)分離文字が接触し、射影によって検出された文字矩形が文字としての意味を持たない文字パターン、又は、1文字に分離文字の一部が接触し、射影によって検出された文字矩形が1文字の文字矩形と隣接文字の一部の文字矩形とから成る文字パターンを含む文字列の画像から各文字パターンを1文字単位で切り出す文字切出方法であって、
(b)入り組み又は接触によって複数文字が射影上1文字に結合された文字矩形として検出される誤結合パターンを登録した辞書データに、前記誤結合パターンに対応する分割位置の情報、及び、分割後の文字矩形が1文字の文字矩形になるか又は1文字に満たない文字矩形になるかの情報を更に登録し、
(c)射影によって検出された文字矩形を結合した状態で前記辞書データとパターンマッチングを行い、マッチングした文字矩形を前記分割位置の情報に基づいて分割し、文字パターンを切り出すことを特徴とする文字切出方法。 - (a)全角文字又は幅の広い文字及び半角文字又は幅の細い文字を含む文字パターンから成る文字列の画像から各文字パターンを1文字単位で切り出して文字認識を行う文字認識装置であって、
(b)誤って結合する文字又は文字の一部を連続した状態で切り出した誤結合パターン、1文字で他の文字とは結合しない文字の文字パターン、及び、前記誤結合パターンに対応する分割位置の情報を辞書データとして登録した辞書と、
(c)射影によって検出された文字矩形を結合した状態で前記辞書データとパターンマッチングを行い、マッチングした文字矩形を前記分割位置の情報に基づいて分割し、文字パターンを切り出す文字パターン切出部とを有することを特徴とする文字認識装置。 - 前記誤って結合する文字又は文字の一部は、半角文字、幅の狭い文字、又は、全角文字若しくは横方向に分離している文字の一部である請求項7に記載の文字認識装置。
- (a)接触文字又は隣り合う文字と結合している文字を含む文字パターンから成る文字列の画像から各文字パターンを1文字単位で切り出して文字認識を行う文字認識装置であって、
(b)入り組み又は接触によって複数文字が射影上1文字の文字矩形として検出される誤結合パターン及び該誤結合パターンに対応する分割位置の情報を辞書データとして登録した辞書と、
(c)射影によって検出された文字矩形を結合した状態で前記辞書データとパターンマッチングを行い、マッチングした文字矩形を前記分割位置の情報に基づいて分割し、文字パターンを切り出す文字パターン切出部とを有することを特徴とする文字認識装置。 - 前記辞書には、複数の文字矩形を結合して1文字となる文字パターンが辞書データとして登録され、前記文字パターン切出部は、射影によって検出された隣り合う文字矩形を結合した状態で登録した辞書データとパターンマッチングを行い、マッチングした文字矩形を他の文字矩形と結合させて文字パターンを切り出す請求項7又は9に記載の文字認識装置。
- 前記辞書データには、隣り合う文字の文字矩形が進入しないように分割情報の間隔が空けられて登録されるとともに、文字が入り組んだ情報が登録され、前記文字パターン切出部は、前記辞書データに基づいて文字パターンを切り出すことにより、文字矩形に隣接の文字矩形が進入しないようにする請求項7〜9のいずれか1項に記載の文字認識装置。
- (a)分離文字が接触し、射影によって検出された文字矩形が文字としての意味を持たない文字パターン、又は、1文字に分離文字の一部が接触し、射影によって検出された文字矩形が1文字の文字矩形と隣接文字の一部の文字矩形とから成る文字パターンを含む文字列の画像から各文字パターンを1文字単位で切り出して文字認識を行う文字認識装置であって、
(b)入り組み又は接触によって複数文字が射影上1文字に結合された文字矩形として検出される誤結合パターン、該誤結合パターンに対応する分割位置の情報、及び、分割後の文字矩形が1文字の文字矩形になるか又は1文字に満たない文字矩形になるかの情報を辞書データとして登録した辞書と、
(c)射影によって検出された文字矩形を結合した状態で前記辞書データとパターンマッチングを行い、マッチングした文字矩形を前記分割位置の情報に基づいて分割し、文字パターンを切り出す文字パターン切出部とを有することを特徴とする文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006264710A JP5041775B2 (ja) | 2006-09-28 | 2006-09-28 | 文字切出方法及び文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006264710A JP5041775B2 (ja) | 2006-09-28 | 2006-09-28 | 文字切出方法及び文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008084105A JP2008084105A (ja) | 2008-04-10 |
JP5041775B2 true JP5041775B2 (ja) | 2012-10-03 |
Family
ID=39354906
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006264710A Active JP5041775B2 (ja) | 2006-09-28 | 2006-09-28 | 文字切出方法及び文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5041775B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5146190B2 (ja) * | 2008-08-11 | 2013-02-20 | オムロン株式会社 | 文字認識装置、文字認識プログラム、および文字認識方法 |
JP6264965B2 (ja) * | 2014-03-14 | 2018-01-24 | オムロン株式会社 | 画像処理装置、画像処理方法、画像処理プログラム |
US9977976B2 (en) | 2016-06-29 | 2018-05-22 | Konica Minolta Laboratory U.S.A., Inc. | Path score calculating method for intelligent character recognition |
US10909700B2 (en) * | 2019-04-02 | 2021-02-02 | Samsung Electronics Co., Ltd. | Display apparatus and image processing method thereof |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6139171A (ja) * | 1984-07-31 | 1986-02-25 | Mitsubishi Electric Corp | 文字認識方式 |
JPH01277989A (ja) * | 1988-04-28 | 1989-11-08 | Nippon Telegr & Teleph Corp <Ntt> | 文字列パターン読み取り装置 |
JPH04372086A (ja) * | 1991-06-21 | 1992-12-25 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
JPH0772906B2 (ja) * | 1991-07-10 | 1995-08-02 | 富士ゼロックス株式会社 | 文書認識装置 |
JP3121091B2 (ja) * | 1991-07-25 | 2000-12-25 | オムロン株式会社 | 文字認識に於ける文字画像の正規化方法 |
JPH05298487A (ja) * | 1992-04-21 | 1993-11-12 | Matsushita Electric Ind Co Ltd | 英文字認識装置 |
JPH0792819B2 (ja) * | 1994-08-16 | 1995-10-09 | 株式会社日立製作所 | パターン切出しおよび認識方法とそのシステム |
JP3197441B2 (ja) * | 1994-10-28 | 2001-08-13 | 沖電気工業株式会社 | 文字認識装置 |
JPH08293000A (ja) * | 1995-04-21 | 1996-11-05 | Canon Inc | 画像処理装置及び方法 |
JP3720873B2 (ja) * | 1995-06-19 | 2005-11-30 | 新日鉄ソリューションズ株式会社 | 手書き文字認識方法及びその装置 |
JP4280355B2 (ja) * | 1999-05-06 | 2009-06-17 | 富士通株式会社 | 文字認識装置 |
JP2003296662A (ja) * | 2002-03-29 | 2003-10-17 | Konica Corp | 文字認識方法及び文字認識装置 |
-
2006
- 2006-09-28 JP JP2006264710A patent/JP5041775B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2008084105A (ja) | 2008-04-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8565474B2 (en) | Paragraph recognition in an optical character recognition (OCR) process | |
KR101122854B1 (ko) | 스캔된 문서들로부터 전자 서식들을 채우기 위한 방법 및장치 | |
US9607237B2 (en) | Image processing apparatus and image processing method | |
US10740899B2 (en) | Image processing apparatus for identifying region within image, information processing method, and storage medium | |
JP3345224B2 (ja) | パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置 | |
JP4280355B2 (ja) | 文字認識装置 | |
US7680329B2 (en) | Character recognition apparatus and character recognition method | |
JP5041775B2 (ja) | 文字切出方法及び文字認識装置 | |
US8989485B2 (en) | Detecting a junction in a text line of CJK characters | |
US7149352B2 (en) | Image processing device, program product and system | |
JP5630689B2 (ja) | 文字認識方法及び文字認識装置 | |
JP5601027B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2000339406A (ja) | 帳票認識方法 | |
Baird | Global-to-local layout analysis | |
Kumar et al. | Line based robust script identification for indianlanguages | |
US11551461B2 (en) | Text classification | |
JP4194020B2 (ja) | 文字認識方法、該方法の実行に用いるプログラム及び文字認識装置 | |
CN117475453B (zh) | 一种基于ocr的文书检测方法、装置及电子设备 | |
EP4036871A1 (en) | Image processing apparatus, image processing method, program and storage medium | |
JP3428504B2 (ja) | 文字認識装置 | |
JPH02230484A (ja) | 文字認識装置 | |
JPH10134145A (ja) | 文字切り出し方法およびそれを用いた文字認識装置と、その文字切り出し方法を実行するプログラムを格納した、コンピュータが読取可能な記憶媒体 | |
Raza | Algorithms for the recognition of poor quality documents | |
JP2943682B2 (ja) | 印刷行検出装置及び印刷行検出方法 | |
JPH10124610A (ja) | 光学式文字読取装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090609 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120113 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120322 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120710 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120710 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5041775 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150720 Year of fee payment: 3 |