JP2008084105A - 文字切出方法及び文字認識装置 - Google Patents
文字切出方法及び文字認識装置 Download PDFInfo
- Publication number
- JP2008084105A JP2008084105A JP2006264710A JP2006264710A JP2008084105A JP 2008084105 A JP2008084105 A JP 2008084105A JP 2006264710 A JP2006264710 A JP 2006264710A JP 2006264710 A JP2006264710 A JP 2006264710A JP 2008084105 A JP2008084105 A JP 2008084105A
- Authority
- JP
- Japan
- Prior art keywords
- character
- pattern
- rectangle
- dictionary data
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】全角文字又は幅の広い文字及び半角文字又は幅の細い文字を含む文字パターンから成る文字列の画像から各文字パターンを1文字単位で切り出す文字切出方法であって、誤って結合する半角文字又は幅の細い文字、及び、1文字で他の文字とは結合しない文字の文字パターンを辞書データとして登録し、射影によって検出された文字矩形とパターンマッチングを行い、マッチングした文字矩形を他の文字矩形とは結合させずに文字パターンを切り出す。
【選択図】図1
Description
((白画素数合計)×255 )/(セル内全画素数) ・・・式(1)
また、手書き文字の場合、文字矩形のパターンのばらつきが多くなるため、文字矩形内の黒で重心を算出し、重心部分を前記分割させたセルの中央に位置させて正規化を行い、上記式(1)によって算出することも可能である。
341 文字コード
Claims (13)
- (a)全角文字又は幅の広い文字及び半角文字又は幅の細い文字を含む文字パターンから成る文字列の画像から各文字パターンを1文字単位で切り出す文字切出方法であって、
(b)誤って結合する半角文字又は幅の細い文字、及び、1文字で他の文字とは結合しない文字の文字パターンを辞書データとして登録し、射影によって検出された文字矩形とパターンマッチングを行い、マッチングした文字矩形を他の文字矩形とは結合させずに文字パターンを切り出すことを特徴とする文字切出方法。 - (a)分離文字を含む文字パターン、又は、1文字が分離した文字パターンから成る文字列の画像から各文字パターンを1文字単位で切り出す文字切出方法であって、
(b)複数の文字矩形を結合して1文字となる文字パターンを辞書データとして登録し、射影によって検出された隣り合う文字矩形を結合した状態で登録した辞書データとパターンマッチングを行い、マッチングした文字矩形を他の文字矩形と結合させて文字パターンを切り出すことを特徴とする文字切出方法。 - (a)接触文字又は隣り合う文字と結合している文字を含む文字パターンから成る文字列の画像から各文字パターンを1文字単位に切り出す文字切出方法であって、
(b)入り組み又は接触によって複数文字が射影上1文字の文字矩形として検出される文字矩形パターンを登録した辞書データとパターンマッチングを行い、マッチングした文字矩形を分割することを特徴とする文字切出方法。 - 前記辞書データに分割位置の情報を登録し、射影によって検出された文字矩形を結合した状態で前記辞書データとパターンマッチングを行い、マッチングした文字矩形を前記分割位置の情報に基づいて分割し、文字パターンを切り出す請求項3に記載の文字切出方法。
- 前記辞書データに、隣り合う文字の文字矩形が進入しないように分割情報の間隔を空けて登録するとともに、文字が入り組んだ情報を登録し、前記辞書データに基づいて文字パターンを切り出すことにより、文字矩形に隣接の文字矩形が進入しないようにする請求項3に記載の文字切出方法。
- (a)分離文字が接触し、射影によって検出された文字矩形が文字としての意味を持たない文字パターン、又は、1文字に分離文字の一部が接触し、射影によって検出された文字矩形が1文字の文字矩形と隣接文字の一部の文字矩形とから成る文字パターンを含む文字列の画像から各文字パターンを1文字単位で切り出す文字切出方法であって、
(b)入り組み又は接触によって複数文字が射影上1文字の文字矩形として検出される文字矩形パターンを登録した辞書データに、分割位置の情報、及び、分割後の文字矩形が1文字の文字矩形になるか又は1文字に満たない文字矩形になるかの情報を更に登録し、
(c)射影によって検出された文字矩形を結合した状態で前記辞書データとパターンマッチングを行い、マッチングした文字矩形を前記分割位置の情報に基づいて分割し、文字パターンを切り出すことを特徴とする文字切出方法。 - (a)請求項1〜6のいずれか1項に記載の文字切出方法を用いる文字認識装置であって、
(b)文字パターンを切り出すための情報を利用し、辞書データとマッチングしない文字矩形も、前後関係又は文字列の位置関係に基づいて、正しく切り出す手段と、
(c)前記辞書データとマッチングして切り出された文字パターンの情報の矛盾に基づいて、誤マッチングして切り出された文字パターンの誤りを訂正する手段とを有する文字認識装置。 - (a)請求項1〜4のいずれか1項に記載の文字切出方法を用いる文字認識装置であって、
(b)前記辞書データに切出で問題のある文字パターンの文字コードを登録し、切出で問題のある文字パターンの文字コードと、文字認識用の辞書データによる認識結果とに基づいて複合的に矛盾をチェックし、矛盾がある場合は不読とすることによって誤読を低減させる手段を有する文字認識装置。 - (a)請求項1〜6のいずれか1項に記載の文字切出方法を用いる文字認識装置であって、
(b)前記辞書データを実現する手段であって、文字矩形に基づく多値階調の正規化されたデータを辞書データとして、該辞書データと文字矩形とが一致するか否かを判定する手段を有する文字認識装置。 - 前記辞書データに登録されたパターンと特徴がほぼ同様の文字矩形に関しては、パターンの特徴が異なる部分に注目し、パターン全体とパターンの一部分とのマッチングを別個に行い、両者がともにマッチングすると、前記文字矩形がマッチングしたものと判定する請求項9に記載の文字認識装置。
- 手書き文字に対し、文字矩形の重心によって正規化した文字切出用の辞書データを作成する請求項9に記載の文字認識装置。
- オペレータによる読取結果の訂正に基づいて学習することによって文字切出用の辞書データを作成する請求項9に記載の文字認識装置。
- 前記文字切出用の辞書データに特定のIDを付加し、文字切出用の辞書データの履歴を作成することにより、文字切出用の辞書データをスリム化して処理速度を向上させる請求項11又は12に記載の文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006264710A JP5041775B2 (ja) | 2006-09-28 | 2006-09-28 | 文字切出方法及び文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006264710A JP5041775B2 (ja) | 2006-09-28 | 2006-09-28 | 文字切出方法及び文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008084105A true JP2008084105A (ja) | 2008-04-10 |
JP5041775B2 JP5041775B2 (ja) | 2012-10-03 |
Family
ID=39354906
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006264710A Active JP5041775B2 (ja) | 2006-09-28 | 2006-09-28 | 文字切出方法及び文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5041775B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101650779A (zh) * | 2008-08-11 | 2010-02-17 | 欧姆龙株式会社 | 字符识别装置、字符识别程序以及字符识别方法 |
JP2015176267A (ja) * | 2014-03-14 | 2015-10-05 | オムロン株式会社 | 画像処理装置、画像処理方法、画像処理プログラム |
US9977976B2 (en) | 2016-06-29 | 2018-05-22 | Konica Minolta Laboratory U.S.A., Inc. | Path score calculating method for intelligent character recognition |
JP2020170515A (ja) * | 2019-04-02 | 2020-10-15 | 三星電子株式会社Samsung Electronics Co.,Ltd. | 映像処理装置及びその映像処理方法 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6139171A (ja) * | 1984-07-31 | 1986-02-25 | Mitsubishi Electric Corp | 文字認識方式 |
JPH01277989A (ja) * | 1988-04-28 | 1989-11-08 | Nippon Telegr & Teleph Corp <Ntt> | 文字列パターン読み取り装置 |
JPH04372086A (ja) * | 1991-06-21 | 1992-12-25 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
JPH0520500A (ja) * | 1991-07-10 | 1993-01-29 | Fuji Xerox Co Ltd | 文書認識装置 |
JPH0581479A (ja) * | 1991-07-25 | 1993-04-02 | Omron Corp | 文字認識に於ける文字画像の正規化方法 |
JPH05298487A (ja) * | 1992-04-21 | 1993-11-12 | Matsushita Electric Ind Co Ltd | 英文字認識装置 |
JPH0773273A (ja) * | 1994-08-16 | 1995-03-17 | Hitachi Ltd | パターン切出しおよび認識方法とそのシステム |
JPH08129608A (ja) * | 1994-10-28 | 1996-05-21 | Oki Electric Ind Co Ltd | 文字認識装置 |
JPH08293000A (ja) * | 1995-04-21 | 1996-11-05 | Canon Inc | 画像処理装置及び方法 |
JPH096920A (ja) * | 1995-06-19 | 1997-01-10 | Nippon Steel Corp | 手書き文字認識方法及びその装置 |
JP2000315247A (ja) * | 1999-05-06 | 2000-11-14 | Fujitsu Ltd | 文字認識装置 |
JP2003296662A (ja) * | 2002-03-29 | 2003-10-17 | Konica Corp | 文字認識方法及び文字認識装置 |
-
2006
- 2006-09-28 JP JP2006264710A patent/JP5041775B2/ja active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6139171A (ja) * | 1984-07-31 | 1986-02-25 | Mitsubishi Electric Corp | 文字認識方式 |
JPH01277989A (ja) * | 1988-04-28 | 1989-11-08 | Nippon Telegr & Teleph Corp <Ntt> | 文字列パターン読み取り装置 |
JPH04372086A (ja) * | 1991-06-21 | 1992-12-25 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
JPH0520500A (ja) * | 1991-07-10 | 1993-01-29 | Fuji Xerox Co Ltd | 文書認識装置 |
JPH0581479A (ja) * | 1991-07-25 | 1993-04-02 | Omron Corp | 文字認識に於ける文字画像の正規化方法 |
JPH05298487A (ja) * | 1992-04-21 | 1993-11-12 | Matsushita Electric Ind Co Ltd | 英文字認識装置 |
JPH0773273A (ja) * | 1994-08-16 | 1995-03-17 | Hitachi Ltd | パターン切出しおよび認識方法とそのシステム |
JPH08129608A (ja) * | 1994-10-28 | 1996-05-21 | Oki Electric Ind Co Ltd | 文字認識装置 |
JPH08293000A (ja) * | 1995-04-21 | 1996-11-05 | Canon Inc | 画像処理装置及び方法 |
JPH096920A (ja) * | 1995-06-19 | 1997-01-10 | Nippon Steel Corp | 手書き文字認識方法及びその装置 |
JP2000315247A (ja) * | 1999-05-06 | 2000-11-14 | Fujitsu Ltd | 文字認識装置 |
JP2003296662A (ja) * | 2002-03-29 | 2003-10-17 | Konica Corp | 文字認識方法及び文字認識装置 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101650779A (zh) * | 2008-08-11 | 2010-02-17 | 欧姆龙株式会社 | 字符识别装置、字符识别程序以及字符识别方法 |
JP2010044485A (ja) * | 2008-08-11 | 2010-02-25 | Omron Corp | 文字認識装置、文字認識プログラム、および文字認識方法 |
JP2015176267A (ja) * | 2014-03-14 | 2015-10-05 | オムロン株式会社 | 画像処理装置、画像処理方法、画像処理プログラム |
US9977976B2 (en) | 2016-06-29 | 2018-05-22 | Konica Minolta Laboratory U.S.A., Inc. | Path score calculating method for intelligent character recognition |
JP2020170515A (ja) * | 2019-04-02 | 2020-10-15 | 三星電子株式会社Samsung Electronics Co.,Ltd. | 映像処理装置及びその映像処理方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5041775B2 (ja) | 2012-10-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101122854B1 (ko) | 스캔된 문서들로부터 전자 서식들을 채우기 위한 방법 및장치 | |
US8565474B2 (en) | Paragraph recognition in an optical character recognition (OCR) process | |
CN105229669B (zh) | 图像处理装置及图像处理方法 | |
US7580571B2 (en) | Method and apparatus for detecting an orientation of characters in a document image | |
US8340425B2 (en) | Optical character recognition with two-pass zoning | |
US6614929B1 (en) | Apparatus and method of detecting character writing area in document, and document format generating apparatus | |
JP4280355B2 (ja) | 文字認識装置 | |
US7680329B2 (en) | Character recognition apparatus and character recognition method | |
JP2008021068A (ja) | 帳票認識装置及び帳票認識プログラム | |
Hesham et al. | Arabic document layout analysis | |
JP5041775B2 (ja) | 文字切出方法及び文字認識装置 | |
US7149352B2 (en) | Image processing device, program product and system | |
US8989485B2 (en) | Detecting a junction in a text line of CJK characters | |
JP5630689B2 (ja) | 文字認識方法及び文字認識装置 | |
JP5601027B2 (ja) | 画像処理装置及び画像処理プログラム | |
Kumar et al. | Line based robust script identification for indianlanguages | |
US11551461B2 (en) | Text classification | |
US20200242390A1 (en) | Information processing apparatus and non-transitory computer readable medium storing program | |
CN117475453B (zh) | 一种基于ocr的文书检测方法、装置及电子设备 | |
EP4036871A1 (en) | Image processing apparatus, image processing method, program and storage medium | |
JP3428504B2 (ja) | 文字認識装置 | |
Leishman | Shape-free statistical information in optical character recognition | |
Raza | Algorithms for the recognition of poor quality documents | |
JP2004013188A (ja) | 帳票読取り装置および帳票読取り方法ならびプログラム | |
JP2023002090A (ja) | 情報処理システム、表示制御方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090609 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120113 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120322 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120710 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120710 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5041775 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150720 Year of fee payment: 3 |