JP2008276458A - 文字列認識方法及び文字列認識装置 - Google Patents
文字列認識方法及び文字列認識装置 Download PDFInfo
- Publication number
- JP2008276458A JP2008276458A JP2007118454A JP2007118454A JP2008276458A JP 2008276458 A JP2008276458 A JP 2008276458A JP 2007118454 A JP2007118454 A JP 2007118454A JP 2007118454 A JP2007118454 A JP 2007118454A JP 2008276458 A JP2008276458 A JP 2008276458A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- character
- image data
- boundary determination
- recognition method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000003384 imaging method Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 13
- 230000001186 cumulative effect Effects 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 239000013598 vector Substances 0.000 description 8
- 238000000605 extraction Methods 0.000 description 5
- 230000007423 decrease Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/158—Segmentation of character regions using character size, text spacings or pitch estimation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
【解決手段】文字列認識方法において、画像データを所定の2値化基準閾値を用いて白黒の2値画像データに加工し、2値画像データを文字列の方向にシフトさせながら、文字列の方向と直交する垂直方向への2値画像データの垂直射影を計算し、垂直射影データが所定の境界判定閾値を超えた箇所を、文字列を構成する文字の区切り位置として検出し、検出された文字の区切り位置に基づいて、文字列から文字を切り出し、切り出した各文字の特徴を判定する各ステップを含み、特徴判定のステップより前に、文字列を構成する文字の個数に基づいて、境界判定閾値の有効性を判定するステップが含まれる。
【選択図】図2
Description
図1は、本発明の実施の形態に係る文字列認識装置1の電気的構成を示すブロック図である。
図2は、本発明の実施の形態に係る文字列認識方法を示すフローチャートである。
以上説明したように本実施形態に係る文字列認識方法は、媒体上の既知の位置に印刷された既知の文字数からなる文字列を、1次元撮像素子で主走査を行い、手動若しくは機械駆動による媒体移動で副走査を行うようにして、2次元の画像情報に変換し、この画像データを適切に処理することによって文字列の認識を行うようにした文字列認識装置において使用される。特に、媒体をスキャンした多値画像を2値化する2値化処理ステップ(図2のステップS2参照)と、媒体移動方向に沿った文字列における文字の区切り位置を検出するために、文字の存在する画像領域に関して主走査方向の射影プロファイルを生成する射影生成ステップと(図2のステップS4参照)、射影に基づいて文字の境界を決定するために必要な境界判定閾値を算出するステップと(図2のステップS5参照)、この境界判定閾値が有効であるか否かを判定する閾値評価ステップと(図2のステップS6参照)、を有し、さらに、境界判定閾値が有効でないと判定されたときには、再度多値媒体画像の2値化を実行する再実行パスを有することにより(図2のステップS7参照)、文字判定処理(図2のステップS11参照)の結果によらず、中間段階で自動的に2値化の妥当性が判断できるため、文字認識を正確かつ短時間に行うことができる。
2 記録担体
11 撮像素子
12 画像メモリ
13 データ処理部
13a 2値化部
13b 行切り出し部
13c 射影生成部
13d 閾値演算部
13e 閾値評価部
13f 境界決定部
13g 特徴抽出部
13h 特徴比較部
13i 特徴辞書格納部
14 文字出力部
Claims (5)
- 媒体上の文字列を撮像して得られた画像データを処理することによって、前記文字列を認識する文字列認識方法において、
前記画像データを所定の2値化基準閾値を用いて白黒の2値画像データに加工する第1ステップと、
前記2値画像データを前記文字列の方向にシフトさせながら、前記文字列の方向と直交する垂直方向への前記2値画像データの垂直射影を計算する第2ステップと、
前記第2ステップにより得られた垂直射影データが所定の境界判定閾値を超えた箇所を、前記文字列を構成する文字の区切り位置として検出する第3ステップと、
前記第3ステップで検出された文字の区切り位置に基づいて、前記文字列から文字を切り出し、切り出した各文字の特徴を判定する第4ステップと、を少なくとも含み、
前記第4ステップより前に、前記文字列を構成する文字の個数に基づいて、前記境界判定閾値の有効性を判定する第5ステップが含まれることを特徴とする文字列認識方法。 - 前記第5ステップにより、前記境界判定閾値が有効でないと判定されたときに、前記2値化基準閾値を変更して、再び前記画像データを2値画像データに加工して、前記第1ステップから前記第5ステップを実行することを特徴とする請求項1記載の文字列認識方法。
- 前記第5ステップにより、前記境界判定閾値が有効でないと判定されたときに、前記2値化基準閾値を当初よりも低い値に変更することを特徴とする請求項2記載の文字列認識方法。
- 前記所定の境界判定閾値は、前記垂直射影データに含まれる正のピーク値を大きい方から順に並べたとき、最も大きなピーク値から数えて、前記文字列を構成する文字の個数に1を加えた個数番目に相当するピーク値であることを特徴とする請求項1から3のいずれか記載の文字列認識方法。
- 請求項1から4のいずれか記載の文字列認識方法を用いて、媒体上の文字列を認識する文字列認識手段を備えたことを特徴とする文字列認識装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007118454A JP5011508B2 (ja) | 2007-04-27 | 2007-04-27 | 文字列認識方法及び文字列認識装置 |
US12/110,524 US8200016B2 (en) | 2007-04-27 | 2008-04-28 | Method and apparatus for character string recognition |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007118454A JP5011508B2 (ja) | 2007-04-27 | 2007-04-27 | 文字列認識方法及び文字列認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008276458A true JP2008276458A (ja) | 2008-11-13 |
JP5011508B2 JP5011508B2 (ja) | 2012-08-29 |
Family
ID=40054345
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007118454A Expired - Fee Related JP5011508B2 (ja) | 2007-04-27 | 2007-04-27 | 文字列認識方法及び文字列認識装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8200016B2 (ja) |
JP (1) | JP5011508B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014238829A (ja) * | 2013-06-06 | 2014-12-18 | ゼロックス コーポレイションXerox Corporation | ナンバープレート自動認識のための適応的文字切り出し方法及びシステム |
JP2021009539A (ja) * | 2019-07-01 | 2021-01-28 | パナソニックIpマネジメント株式会社 | 文字領域決定方法 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4626777B2 (ja) * | 2008-03-14 | 2011-02-09 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
CN101984426B (zh) * | 2010-10-21 | 2013-04-10 | 优视科技有限公司 | 用于对网页图片进行字符切分的方法及装置 |
EP2645305A3 (en) * | 2012-03-26 | 2014-05-14 | Tata Consultancy Services Limited | A system and method for processing image for identifying alphanumeric characters present in a series |
US10402704B1 (en) * | 2015-06-30 | 2019-09-03 | Amazon Technologies, Inc. | Object recognition with attribute-based cells |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05307640A (ja) * | 1992-04-30 | 1993-11-19 | Toshiba Corp | 文字読取装置 |
JPH07325882A (ja) * | 1994-05-30 | 1995-12-12 | Nippon Steel Corp | 文字認識装置及び文字認識方法 |
JPH087031A (ja) * | 1994-06-22 | 1996-01-12 | Nec Corp | 文字枠検出装置 |
JPH08305795A (ja) * | 1995-04-28 | 1996-11-22 | Nippon Steel Corp | 文字認識方法 |
JP2002157552A (ja) * | 2000-11-22 | 2002-05-31 | Oki Electric Ind Co Ltd | 光学式文字読取装置 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02268388A (ja) * | 1989-04-10 | 1990-11-02 | Hitachi Ltd | 文字認識方法 |
US5825920A (en) * | 1991-01-28 | 1998-10-20 | Hitachi, Ltd. | Method and unit for binary processing in image processing unit and method and unit for recognizing characters |
US5253304A (en) * | 1991-11-27 | 1993-10-12 | At&T Bell Laboratories | Method and apparatus for image segmentation |
JPH07129713A (ja) | 1993-11-01 | 1995-05-19 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
JP3335009B2 (ja) * | 1994-09-08 | 2002-10-15 | キヤノン株式会社 | 画像処理方法及び画像処理装置 |
US5889884A (en) * | 1995-05-23 | 1999-03-30 | Minolta Co., Ltd. | Image forming apparatus capable of recognizing top and bottom of document image |
JP2812256B2 (ja) | 1995-06-30 | 1998-10-22 | 日本電気株式会社 | 文字認識装置および方法 |
JP2974061B2 (ja) * | 1996-11-13 | 1999-11-08 | 日本電気株式会社 | パタン抽出装置 |
JP3639126B2 (ja) * | 1998-01-22 | 2005-04-20 | 富士通株式会社 | 住所認識装置及び住所認識方法 |
JP2001022884A (ja) | 1999-07-07 | 2001-01-26 | Oki Electric Ind Co Ltd | 文字認識装置 |
US6473517B1 (en) * | 1999-09-15 | 2002-10-29 | Siemens Corporate Research, Inc. | Character segmentation method for vehicle license plate recognition |
US6470094B1 (en) * | 2000-03-14 | 2002-10-22 | Intel Corporation | Generalized text localization in images |
US20060013511A1 (en) * | 2004-07-16 | 2006-01-19 | Brian De Champlain | Method and apparatus for identifying optical media |
US7302098B2 (en) * | 2004-12-03 | 2007-11-27 | Motorola, Inc. | Character segmentation method and apparatus |
-
2007
- 2007-04-27 JP JP2007118454A patent/JP5011508B2/ja not_active Expired - Fee Related
-
2008
- 2008-04-28 US US12/110,524 patent/US8200016B2/en not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05307640A (ja) * | 1992-04-30 | 1993-11-19 | Toshiba Corp | 文字読取装置 |
JPH07325882A (ja) * | 1994-05-30 | 1995-12-12 | Nippon Steel Corp | 文字認識装置及び文字認識方法 |
JPH087031A (ja) * | 1994-06-22 | 1996-01-12 | Nec Corp | 文字枠検出装置 |
JPH08305795A (ja) * | 1995-04-28 | 1996-11-22 | Nippon Steel Corp | 文字認識方法 |
JP2002157552A (ja) * | 2000-11-22 | 2002-05-31 | Oki Electric Ind Co Ltd | 光学式文字読取装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014238829A (ja) * | 2013-06-06 | 2014-12-18 | ゼロックス コーポレイションXerox Corporation | ナンバープレート自動認識のための適応的文字切り出し方法及びシステム |
JP2021009539A (ja) * | 2019-07-01 | 2021-01-28 | パナソニックIpマネジメント株式会社 | 文字領域決定方法 |
Also Published As
Publication number | Publication date |
---|---|
US20080304746A1 (en) | 2008-12-11 |
US8200016B2 (en) | 2012-06-12 |
JP5011508B2 (ja) | 2012-08-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5334042B2 (ja) | 文字列認識方法及び文字列認識装置 | |
US7636483B2 (en) | Code type determining method and code boundary detecting method | |
US7949187B2 (en) | Character string recognition method and device | |
JP6268023B2 (ja) | 文字認識装置およびその文字切り出し方法 | |
JP5591578B2 (ja) | 文字列認識装置および文字列認識方法 | |
JP4911340B2 (ja) | 二次元コード検出システムおよび二次元コード検出プログラム | |
US8462394B2 (en) | Document type classification for scanned bitmaps | |
JP6171167B2 (ja) | 文字認識装置、文字認識方法、及び文字認識プログラム | |
US5915039A (en) | Method and means for extracting fixed-pitch characters on noisy images with complex background prior to character recognition | |
JP2001092919A (ja) | 2次元バーコードのねじれ角決定法 | |
JP2002133426A (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
JP6039413B2 (ja) | 文字切り出し装置、文字認識装置、文字切り出し方法、およびプログラム | |
JP5011508B2 (ja) | 文字列認識方法及び文字列認識装置 | |
JP6487255B2 (ja) | 文字切り出し装置、文字認識装置、および文字切り出し方法 | |
JP4945739B2 (ja) | 文字列認識方法及び文字列認識装置 | |
JP6599672B2 (ja) | 文字切り出し装置、文字認識装置、および文字切り出し方法 | |
JP5630689B2 (ja) | 文字認識方法及び文字認識装置 | |
CN116469090A (zh) | 喷码图案的检测方法、装置、电子设备和存储介质 | |
JP2008084105A (ja) | 文字切出方法及び文字認識装置 | |
JP6144892B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
Tkachenko et al. | Robustness of character recognition techniques to double print-and-scan process | |
KR101070051B1 (ko) | 도트 패턴에서 불변 영역을 인식하는 방법 | |
JP2022186250A (ja) | 画像処理装置、画像処理方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20091224 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110609 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110614 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110810 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120131 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120413 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120507 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150615 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5011508 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |